>>>>>

Scheda 6 - Problemi tipici della statistica matematica

5. INDIVIDUAZIONE di una LEGGE di distribuzione. Gli "ZOMBIE". Leggi di distribuzione ESPONENZIALE e di POISSON.

    Per fare un esempio del problema A del §2 consideriamo il seguente fenomeno:

ogni secondo arriva uno zombie di fronte a un muro lungo 1 in cui è praticata un'apertura ampia w; gli zombie che non passano attraverso l'apertura, dopo la facciata contro il muro si rialzano e si predispongono a ritentare l'avventura, per cui il flusso di zombie è senza fine, e sempre con lo stesso regime; inoltre:

(1)   le posizioni lungo il muro in cui arrivano gli zombie hanno distribuzione uniforme (non viene privilegiata alcuna parte del muro), per cui, ovunque sia collocata l'apertura, per essa c'è un flusso stazionario di zombie (la media teorica del numero di zombie Nw che passano in un intervallo di tempo fissato è proporzionale a w: M(Nw)=λw);

(2)   la posizione di arrivo di ogni zombie è indipendente da quella di ciascuno dei precedenti, cioè siamo di fronte a un flusso senza memoria;

(3)   è trascurabile la probabilità che due o più zombie arrivino praticamente nella stessa posizione, cioè, al rimpicciolire dell'apertura, la differenza relativa tra Pr(1≤Nw) e Pr(Nw=1) tenda ad annullarsi (per w 0 Pr(Nw=1)/Pr(1≤Nw) 1); in casi come questo si parla di flusso ordinario.

    Si può simulare il fenomeno usando RND. Basta indicare con w la ampiezza della apertura e ogni secondo eseguire l'istruzione:

    IF RND<w THEN U=1 ELSE U=0

U=1 indica il passaggio dello zombie per l'apertura – evento con probabilità w = (ampiezza apertura)/(lungh. muro) –, U=0 il non passaggio.

  

    Infatti il generatore di numeri pseudocasuali verifica (1) e (2), come abbiamo già osservato, e (come si può controllare sperimentalmente) verifica anche (3); su ciò si tornerà nella scheda 8.

    Sviluppando questa idea è stato realizzato il programma ZOMBIE.bas, che simula il fenomeno nel caso in cui w=1/10. Il programma ha due modalità: tempi "veri" e tempi "abbreviati". Man mano che arrivano gli zombie, esso costruisce l'istogramma di distribuzione (in intervalli ampi 1 sec) dei tempi di attesa tra un passaggio per l'apertura e il passaggio successivo. Ecco un possibile stato finale del programma:

                                                            O
                                                                      O
                 O
                                    O
                                  O
                               O
 ===================================       O=====================================
 ===================================  O     =====================================
 X                                 |        |
 X                                 |        |
 X                                 |        |
 X                                 |        |
 XX                                 O
 XX
 XX  X
 XXX X X
 XXX X X
 XXX XXX
 XXXXXXX
 XXXXXXXXX       X
 XXXXXXXXX  XX   X
 XXXXXXXXX  XXX  X
 XXXXXXXXX XXXX  XX              X
 XXXXXXXXX XXXXXXXX    X       X X
 XXXXXXXXXXXXXXXXXXX XXXX XX X XXXXX  X          XX   X  X

3

 Esegui ZOMBIE.bas sia con tempi "veri" che con tempi "abbreviati" [in alternativa puoi usare un programma direttamente eseguibile cliccando QUI].

    Come si vede, l'istogramma ha, grosso modo, andamento decrescente, simile all'istogramma della distribuzione esponenziale negativa. Per studiare meglio il fenomeno posso utilizzare FA_RND.bas. Posso generalizzarlo alla situazione in cui gli zombie non partono esattamente ogni secondo, ma partano mediamente ogni secondo. Supponiamo, ad es., che tra una partenza e l'altra passi un tempo in sec che cade in [0,2) con distribuzione uniforme. Allora possiamo completare il sub Prova nel modo seguente (registrato come T-Zombie.bas):

w = 1/10                           ' ampiezza porta
U=RND*2                         ' passa mediamente 1 sec
WHILE RND>w : U=U+RND*2 : WEND  ' aspetto che venga generato RND <= w

    Analogamente, con N-Zombie.bas si può studiare quanti zombie passano per l'apertura in 60 secondi:

w = 1/10 : U=0 : t=0
WHILE t<60
t=t+RND*2 : IF RND<w THEN U=U+1
WEND

4

 Di seguito sono riprodotti gli esiti che si ottengono analizzando con STAT i file generati nel modo detto sopra, con 2000 prove. Supponiamo di aver dato ad essi rispettivamente i nomi T-ZOMBIE.stf e N-ZOMBIE.stf (se vuoi, genera direttamente tu i file; potresti ottenere uscite diverse: è stato utilizzato RANDOMIZE TIMER). Esamina e discuti questi esiti.

    L'analisi di T-ZOMBIE.stf rafforza l'idea che la differenza temporale Dw tra due successivi passaggi per l'apertura abbia distribuzione esponenziale negativa (come nel caso dei tempi di attesa tra una telefonata e l'altra nella situazione considerata nella scheda 1): ciò è suggerito sia dalla forma dell'istogramma, sia dal fatto che s.q.m. e media siano quasi uguali (U con distribuzione esponenziale negativa ha M(U)=σ(U)).

    Vedremo nel prossimo paragrafo come, senza questi "suggerimenti", si sarebbe potuto congetturare l'andamento esponenziale dell'istogramma.

    Si può dimostrare teoricamente che, nelle ipotesi fatte, Dw (sopra studiata statisticamente) ha effettivamente funzione di densità x w·e–wx (e funzione di ripartizione x 1–e–wx) con w = ampiezza della apertura del muro, cioè con 1/w = tempo di attesa medio (in sec).

"Idea" della dimostrazione. Sia F la funzione di ripartizione di Dw, cioè F(t)=Pr(Dw≤t)=1–Pr(Dw>t); Pr(Dw>t) non è altro che la probabilità che, passato uno zombie in un istante t0 qualunque (stazionarietà), durante l'intervallo [t0,t0+t) non passino zombie. Questa probabilità non cambia se nell'istante t0 non fosse passato uno zombie (assenza di memoria), cioè Pr(Dw>t) è la probabilità che in un qualunque intervallo di tempo di ampiezza t non passino zombie per l'apertura. Se A è l'evento che non passino zombie in un intervallo di ampiezza t1 e B quello che non ne passino nel successivo intervallo ampio t2, per quanto detto Pr(A)=Pr(Dw>t1) e Pr(B)=Pr(Dw>t2); A and B è l'evento che non passino zombie per il tempo t1+t2, per cui Pr(A and B)=Pr(Dw>t1+t2); gli eventi A e B, per l'assenza di memoria, sono indipendenti, quindi: Pr(Dw>t1+t2) = Pr(Dw>t1)·Pr(Dw>t2). Da qui si deduce che t Pr(Dw>t) è esponenziale. Dal fatto che F sia del tipo "1–esponenziale" si deduce, derivando, che la funzione densità è esponenziale.

    L'andamento dell'istogramma di N-ZOMBIE.stf è simile a quello di una binomiale non simmetrica. In realtà si può dimostrare che, fissata una durata di tempo T (in sec), il numero di zombie Nw che passano per l'apertura in un intervallo di tempo ampio T ha legge di distribuzione:

Pr(Nw= n) =  an  e–a     con  a = numero medio di zombie che
passano per l'apertura nel tempo T
——
n!

Poiché nel nostro caso T = 60, a = wT = 6.

    È una funzione (di n) che all'inizio sale quasi esponenzialmente, poi scende, quando n! prevale su an. È una legge di distribuzione in quanto Pr(Nw=0)+Pr(Nw=1)+Pr(Nw=2)+… = ea·ea = 1.

    Osserviamo che Pr(Nw=0), valore che esprime la probabilità che non passino zombie, deve essere uguale a Pr(Dw>T), cioè alla probabilità che la differenza temporale tra due passaggi sia maggiore di T.

    Verifichiamolo: Pr(Nw=0) = ea ; Pr(Dw>T) = 1–Pr(Dw≤T) = 1–(1–e-wT) = e-wT = ea.

    Questa legge di distribuzione si chiama legge di Poisson (di parametro a).

    Si può dimostrare che M(Nw) = V(Nw) = a.

    Ciò è in accordo con gli esiti sperimentali: media = 6.119; s.q.m. = 2.39; 6.119 = 2.49.

    Verifichiamo graficamente la corrispondenza di questa legge con l'istogramma sperimentale.

5

 Importa in POLIGON il file NZ.gfu in cui sono già stati registrati i punti che congiunti forniscono il contorno dell'istogramma (normalizzato) di n-zombie e visualizzalo. Quindi, posto p(x)=#a^x/!(x)exp(-#a) per rappresentare la legge di Poisson e definito opportunamente il parametro, traccia la poligonale di distribuzione di tale legge, in modo da ottenere alla fine la figura sotto riprodotta a sinistra.

    L'esito conferma l'accordo tra esperimento e legge teorica.

6

 Verifica graficamente come all'aumentare del parametro la poissoniana tende ad assumere andamento simmetrico a campana ( figura soprastante a destra, per a=6 e a=12).

    Abbiamo già osservato che la curva poissoniana assomiglia a una binomiale. In effetti si può dimostrare (e verificare graficamente con POLIGON) che la legge di Poisson approssima la legge binomiale Bn,p con n·p=a, e che, fissato a, questa approssimazione migliora al crescere di n (la poissoniana, quindi, come la bernulliana, tende a confondersi con una curva di Gauss, e con questa spesso può essere approssimata).

    In altre parole l'approssimazione migliora man mano che p (=a/n) tende a 0, cioè più è raro l'evento di cui conto il verificarsi nelle n prove ripetute. Per questo a volte la legge di Poisson viene anche chiamata legge degli eventi rari.

    L'impiego della legge di Poisson è frequente. Infatti sono molte le situazioni che si comportano analogamente alla situazione degli "zombie", cioè in cui si ha a che fare con:

(1)   elementi che si distribuiscono uniformemente in un certo "spazio",

(2)   cadendo in modo stocasticamente indipendente in sottospazi disgiunti, e

(3)   tendenzialmente, senza sovrapporsi.

e si vuole valutare la probabilità che cada una certa quantità di elementi in una porzione di spazio di dimensione w fissata, noto il numero medio a di elementi che cadono in una porzione di dimensione w.

Esempio. Una lamiera presenta dei piccoli difetti che si collocano in modo soddisfacente le condizioni sopra descritte, con densità di 0.03 difetti per cm2. La probabilità che un pezzo di 10 cm2 abbia almeno un difetto è: 1–Pr(Nw=0) = 1 – e–0.3 = 0.259; infatti a = 0.03·10 = 0.3.

    Anche le situazioni di "eventi rari" possono essere interpretate in questo modo. Consideriamo, ad esempio, un campione radioattivo che contenga 2.5·1021 nuclei; ogni nucleo abbia, in ogni istante, la probabilità 5.2·10-21 di decadere entro 1 minuto; vogliamo trovare qual è la probabilità che il numero N dei decadimenti in un minuto sia 2. Dovremmo assegnare ad N la legge Bn,p con n=2.5·1021 e p=5.2·10-21 (n è praticamente costante), ma ci troveremmo di fronte ad elevamenti alla potenza proibitivi.

    Per quanto osservato sopra possiamo approssimare questo valore usando la legge di Poisson con a=np=13: Pr(N=2)=132/2·e-13=1.91·10-4. Ma anche senza passare attraverso la binomiale potevano osservare che gli atomi decadono in tempi che si succedono rispettando le condizioni (1)–(3) (ad esempio la (1) corrisponde al fatto che l'emissione di elettroni è più o meno costante), e che il numero medio (a) di nuclei che decadono nel tempo di 1 minuto (w) è np.

7

 La densità media dei microbi nocivi per metro cubo di aria in un certo ambiente è 100. Qual è la probabilità che un campione di 2 litri di aria abbia almeno un microbo?

<<<     Paragrafo precedente Paragrafo successivo     >>>