>>>>>

Scheda 6 - Problemi tipici della statistica matematica

2. Alcuni problemi tipici della Satistica Matematica.

    In questa scheda illustreremo e esemplificheremo alcuni problemi tipici della statistica matematica:

(A) INDIVIDUAZIONE DI LEGGI DI DISTRIBUZIONE IN BASE AI DATI STATISTICI

    Se per un fenomeno casuale si può disporre di un numero molto grande di dati sperimentali, si possono fare valutazioni probabilistiche molto accurate (come, ad esempio per le altezze della scheda 2, in cui addirittura conosco la distribuzione esatta della popolazione).

    Altrimenti occorre, con opportuni metodi, individuare relazioni analitiche (possibilmente semplici) che approssimino i dati sperimentali cercando di individuare, al di là degli aspetti aleatori dovuti al piccolo numero dei dati sperimentali, le regolarità che caratterizzano il fenomeno.

  Abbiamo fatto più volte attività di questo genere, ma sempre molto guidate (come nella scheda 1, quando abbiamo individuato la legge di distribuzione esponenziale negativa per le differenze dei tempi di arrivo delle telefonate) o in casi in cui si conoscevano elementi che permettevano di determinare teoricamente la distribuzione (come nel caso del lancio di dadi o monete equi, nel caso di RND*RND, …): in questi casi l'approccio "sperimentale", mediante una simulazione, era introdotto per suggerire o convalidare una trattazione teorica basata sul modo in cui avevamo definito le variabili aleatorie.

    In questa scheda affronteremo una situazione più complessa.

(B) VERIFICA DELLA VEROSIMIGLIANZA DELLE IPOTESI

    Valutata la probabilità di un evento o individuata una legge di distribuzione o … solo sulla base di dati sperimentali, non abbiamo la certezza di questa conclusione. Possiamo, comunque, porci il problema di quanto sia verosimile l'ipotesi che il valore o la funzione o … individuata sia effettivamente una buona approssimazione, cioè valutare la probabilità che il suo scarto dall'oggetto (valore, funzione, …) "vero" rientri nei margini di aleatorietà dovuta alla limitatezza del materiale statistico a disposizione. In base a questa valutazione, a seconda della situazione (con considerazioni pratiche, legate al contesto, ai rischi sociali, … fine del §3 della scheda 3), potremo stabilire se tale ipotesi è accettabile o è da rifiutare.

  Abbiamo affrontato attività di questo tipo alla fine della scheda 5: all'intervallo frequenza ± 3 σ/n associo la probabilità di confidenza del 99.7% che esso contenga la probabilità Pr(A) cercata; all'intervallo frequenza ± t σ/n con t<3 posso associare una probabilità di confidenza più piccola; in altre parole valuto la probabilità che tale l'intervallo sia veramente un intervallo di indeterminazione per Pr(A).

    Se in base a qualche ragionamento ho ipotizzato che Pr(A) sia 3/7 e trovo che 3/7 sta nell'intervallo frequenza ± t σ/n, posso ritenere attendibile (con una opportuna confidenza) che lo scarto tra 3/7 e frequenza sia "normale", cioè ritenerlo non "significativo", non tale da giustificare il rifiuto dell'ipotesi. Questa terminologia (accettazione/rifiuto dell'ipotesi) in realtà non è fondata: la probabilità dell'ipotesi che Pr(A) sia "esattamente" 3/7 è nulla. Ma, purtroppo, è un modo di esprimersi diffuso presso gli "statistici".

    In questa scheda vedremo in particolare come valutare l'attendibilità di una legge di distribuzione.

(C) STIMA DEI PARAMETRI INCOGNITI DI UNA LEGGE DI DISTRIBUZIONE

    In alcune situazioni, per considerazioni di tipo teorico, conosciamo a priori il tipo di legge di distribuzione che segue una data variabile casuale. In questo caso si pone solo il problema di stimare, sulla base dei dati sperimentali, i parametri che caratterizzano la specifica variabile aleatoria (ad es. la media e lo s.q.m. se la distribuzione è normale, la sola media se la distribuzione è esponenziale; scheda 4, §4).

  Abbiamo svolto varie attività di questo genere. In genere abbiamo assunto media statistica e s. q. m. statistico come stime dei corrispondenti valori teorici. In questa scheda valuteremo criticamente questa scelta.

    I problemi A, B e C, che abbiamo distinto per comodità, sono ovviamente intrecciati. Ad esempio individuando una legge di distribuzione o stimando un parametro, si pone il problema di discutere la verosimiglianza di questa scelta.

<<<     Paragrafo precedente Paragrafo successivo     >>>