2. Alcuni problemi tipici della Satistica Matematica.
In questa scheda illustreremo e esemplificheremo alcuni problemi tipici della statistica matematica:
(A) INDIVIDUAZIONE DI LEGGI DI DISTRIBUZIONE IN BASE AI DATI STATISTICI
Se per un fenomeno casuale si può disporre di un numero molto grande di dati sperimentali, si possono fare valutazioni probabilistiche molto accurate (come, ad esempio per le altezze della scheda 2, in cui addirittura conosco la distribuzione esatta della popolazione).
Altrimenti occorre, con opportuni metodi, individuare relazioni analitiche (possibilmente semplici) che approssimino i dati sperimentali cercando di individuare, al di là degli aspetti aleatori dovuti al piccolo numero dei dati sperimentali, le regolarità che caratterizzano il fenomeno.
Abbiamo fatto più volte attività di questo genere, ma sempre molto guidate (come nella scheda 1, quando abbiamo individuato la legge di distribuzione esponenziale negativa per le differenze dei tempi di arrivo delle telefonate) o in casi in cui si conoscevano elementi che permettevano di determinare teoricamente la distribuzione (come nel caso del lancio di dadi o monete equi, nel caso di RND*RND, …): in questi casi l'approccio "sperimentale", mediante una simulazione, era introdotto per suggerire o convalidare una trattazione teorica basata sul modo in cui avevamo definito le variabili aleatorie.
In questa scheda affronteremo una situazione più complessa.
(B) VERIFICA DELLA VEROSIMIGLIANZA DELLE IPOTESI
Valutata la probabilità di un evento o individuata una legge di distribuzione o … solo sulla base di dati sperimentali, non abbiamo la certezza di questa conclusione. Possiamo, comunque, porci il problema di quanto sia verosimile l'ipotesi che il valore o la funzione o … individuata sia effettivamente una buona approssimazione, cioè valutare la probabilità che il suo scarto dall'oggetto (valore, funzione, …) "vero" rientri nei margini di aleatorietà dovuta alla limitatezza del materiale statistico a disposizione. In base a questa valutazione, a seconda della situazione (con considerazioni pratiche, legate al contesto, ai rischi sociali, … fine del §3 della scheda 3), potremo stabilire se tale ipotesi è accettabile o è da rifiutare.
Abbiamo affrontato attività di questo tipo alla fine della scheda 5: all'intervallo frequenza
Se in base a qualche ragionamento ho ipotizzato che Pr(A) sia 3/7 e trovo che 3/7 sta nell'intervallo frequenza
In questa scheda vedremo in particolare come valutare l'attendibilità di una legge di distribuzione.
(C) STIMA DEI PARAMETRI INCOGNITI DI UNA LEGGE DI DISTRIBUZIONE
In alcune situazioni, per considerazioni di tipo teorico, conosciamo a priori il tipo di legge di distribuzione che segue una data variabile casuale. In questo caso si pone solo il problema di stimare, sulla base dei dati sperimentali, i parametri che caratterizzano la specifica variabile aleatoria (ad es. la media e lo s.q.m. se la distribuzione è normale, la sola media se la distribuzione è esponenziale; scheda 4, §4).
Abbiamo svolto varie attività di questo genere. In genere abbiamo assunto media statistica e s. q. m. statistico come stime dei corrispondenti valori teorici. In questa scheda valuteremo criticamente questa scelta.
I problemi A, B e C, che abbiamo distinto per comodità, sono ovviamente intrecciati. Ad esempio individuando una legge di distribuzione o stimando un parametro, si pone il problema di discutere la verosimiglianza di questa scelta.
<<< Paragrafo precedente | Paragrafo successivo >>> |