Scheda 5 - Par. 4

Scheda 5 - I teoremi limite

4. Uso della gaussiana per approssimare calcoli inerenti distribuzioni binomiali. La legge BINOMIALE non simmetrica. Rappresentazione e calcolo con POLIGON.

Il teorema limite centrale giustifica anche l'uso della distribuzione gaussiana per risolvere problemi inerenti distribuzioni binomiali, a cui siamo già ricorsi nella scheda 4, §2.. Vediamo un nuovo esempio.

La probabilità che un prodotto di un certo tipo sia difettoso è 1%. Qual è la probabilità che tra 10000 pezzi scelti a caso non ve ne siano più di 70 difettosi?

Ragioniamo in modo simile a quanto fatto risolvendo il quesito 10 della scheda 3.

Sia N la variabile casuale a valori in {0, 1, …, 10000} che rappresenta il numero di pezzi difettosi.

È sensato ritenere indipendenti le estrazioni dei pezzi. Quindi la probabilità che esattamente i primi k pezzi estratti siano difettosi è:
1%·1%·…·1%·99%·99%·…·99% = 1%^k·99%^10000-k.
Poiché non ci interessa la disposizione dei pezzi difettosi, abbiamo:
Pr(N=k) = C(10000,k)·1%^k·99%^10000–k.

Generalizzando dal caso di 10000 pezzi a quello di n pezzi, dal caso della difettosità all'1% a quello della difettosità con probabilità p, abbiamo:

Pr(N = k) = C(n,k) · p^k · (1 – p)^n-k.

Anche questa legge di distribuzione, che generalizza quella considerata nella scheda 3, viene chiamata legge di distribuzione binomiale. Si applica a tutte le situazioni in cui si ripete n volte la prova su una variabile casuale che può assumere solo due valori, in cui p è la probabilità di uno di questi due valori e N è il numero delle volte in cui questo valore esce.

Nel nostro caso dobbiamo calcolare Σ_k C(10000,k)·1%^k·99%^10000-k (k=0,…,70).
Ma il calcolo di C(10000,70) eccede le capacità di un usuale mezzo di calcolo (si verificherebbe un overflow).

Possiamo tuttavia osservare che N è interpretabile come ΣX_i (i=1,…,n) con X_i a valori in {0,1} e distribuzione: Pr(X_i=1) = p, Pr(X_i=0) = 1–p. Da qui abbiamo che:

M(N) = M(ΣX_i) = ΣM(X_i) = p+…p = np e che:

Var(N) = Var(ΣX_i) = ΣVar(X_i) = np(1–p),
poiché Var(X_i) = M((X_i-M(X_i))²) = Pr(X_i=1)(1–p)² + Pr(X_i=0)(0–p)² = p(1–p).

Nel nostro caso, poiché n=10000, ricorrendo al teorema limite centrale, possiamo approssimare N con la gaussiana U di media np = 10000·1% = 100 e σ = (np(1-p)) = 99.

Utilizzando la tabella della funzione di ripartizione gaussiana standard ( scheda 4, §3) o il programmino apribile dalla stessa scheda, oppure POLIGON (o una calcolatrice con funzioni statistico-probabilistiche o Derive o Maple o …) possiamo trovare la probabilità cercata.

• Con Poligon calcolo l'integrale tra -0.5 (o un valore inferiore) e 70.5 della funzione F descritta a lato (ottenuta con f(x)=gauss); ho: 0.1514%. Ho integrato tra questi estremi in quanto N=0 e N=70 corrispondono a U [–0.5, 0.5] e a U [69.5, 70.5] ( scheda 4, §2). In alternativa, utilizzando la simmetria di F rispetto a 100, potevo determinare l'integrale Q tra 70.5 e 100 e poi calcolare il valore 0.5–Q.

F(x)= 1/(SQR(2*PI)*#S)*EXP(-(x-#M)^2/(2*#S^2)) #m=100 #s=SQR(99)

•Usando la funzione di ripartizione gaussiana standard, sia essa H, dopo opportuni "cambi di scala" ((100–70.5)/99 = 2.965: vedi figura a lato), mi riconduco a trovare H(–2.965).
Dalla tabella ho: 0.00135 = Pr(H<–3) < Pr(H<–2.965) < Pr(H<–2.9) = 0.00187.
Deduco che la probabilità cercata è circa 0.15%.
Anche interpolando avrei: 0.00135 + 0.035/0.1·0.00052 = 0.00135+0.00018…, cioè, arrotondando, 0.15%.

Il grafico della legge binomiale B_n,p di ordine n e "probabilità di successo nella singola prova" p quando, come nel caso appena considerato, n è molto grande, è pressoché simmetrico in quanto approssimabile con una gaussiana.
A lato sono raffigurati per p=0.2 i casi n = 50, 20, 10 (i punti che rappresentano P(N=k) per k alto hanno ordinata trascurabile rispetto al punto modale, per cui appaiono confusi con l'asse orizzontale). Più n è piccolo, più è evidente la asimmetria, con una "coda" verso destra.

Nota. I grafici sopra raffigurati sono stati tracciati con Poligon, come grafici (sugli interi: vedi scheda 4, §1.) della funzione B a fianco, che viene automaticamente caricata battendo B(x)=binom, per #n=50, #n=20 e #n=10.

B(x)=!(#N)/(!(#N-x)*!(x))*#P^x*(1-#P)^(#N-x) #p=0.2

Come si vede dai grafici, per n "piccolo" la gaussiana non fornisce una buona approssimazione.

8

Un apparecchio, composto da 10 elementi omogenei, funziona a patto che funzionino almeno 7 elementi. L'affidabilità di ciascun elemento in un intervallo di tempo dato è 0.8. Qual è la probabilità che, nell'intervallo dato, l'apparecchio vada fuori uso?

Con POLIGON avremmo potuto procedere battendo "1-(B(0)+B(1)+B(2)+B(3))=", con B definita come indicato nella nota precedente (e #n=10), o "[4,10] B Sum". Si ottiene: 0.120873... = 12.1%.

<<< Paragrafo precedente

Paragrafo successivo >>>