Di un cavo di gomma prodotto industrialmente sono stati esaminati tratti consecutivi lunghi ciascuno 100 m e si sono individuati quanti sono i difetti in ciascuno di essi. Si è ottenuta la seguente distribuzione
numero difetti riscontrati |
0 | 1 | 2 | 3 | 4 | 5 |
numero tratti con tale numero di difetti |
35 | 45 | 40 | 23 | 4 | 3 |
Le osservazioni sono 150. Il numero medio di difetti per tratto è 225/150 = 3/2.
La legge di Poisson è dunque
Il numero atteso di tratti con k difetti è Pr(N=k)·150.
Possiamo calcolare χ2 con una calcolatrice, un foglio di calcolo o (meglio) con altro software
(come vedremo più avanti).
Ecco come trovarlo con un foglio di calcolo; qui sotto sono indicate le formule inserite nelle celle
della riga 2 e poi copiate in basso; le formule sono quelle nel caso in cui il foglio di calcolo sia impostato in lingua italiana.
B2: =(3/2)^A2*EXP(-3/2)/FATTORIALE(A2)
C2: =B2*150
E2: =(D2-C2)^2/C2
F2: =SOMMA(E2:E7)
Nella colonna osservati sono state inserite le frequenze osservate.
A | B | C | D | E | F | |
1 | K | Pr(N=k) | Attesi | Osservati | (Os-At)^2/At | χ2 |
2 | 0 | 0.2231 | 33.4695 | 35 | 0.0700 | 3.37 |
3 | 1 | 0.3347 | 50.2043 | 45 | 0.5395 | |
4 | 2 | 0.2510 | 37.6532 | 40 | 0.1463 | |
5 | 3 | 0.1255 | 18.8266 | 23 | 0.9251 | |
6 | 4 | 0.0471 | 7.0600 | 4 | 1.3263 | |
7 | 5 | 0.0141 | 2.1180 | 3 | 0.3673 |
Vediamo come procedere con degli script online. Con questa calcolatrice ottengo i valori attesi:
pow( 3/2, 0)*exp(-3/2) / (1)*150 = 33.46952402226447 pow( 3/2, 1)*exp(-3/2) / (1)*150 = 50.20428603339671 pow( 3/2, 2)*exp(-3/2) / (1*2)*150 = 37.65321452504753 pow( 3/2, 3)*exp(-3/2) / (1*2*3)*150 = 18.826607262523765 pow( 3/2, 4)*exp(-3/2) / (1*2*3*4)*150 = 7.059977723446412 pow( 3/2, 5)*exp(-3/2) / (1*2*3*4*5)*150 = 2.117993317033924 |
che posso arrotondare: 33.47, 50.20, 37.65, 18.83, 7.06, 2.12
Poi con quest'altro script online (vedi) ottengo:
O: 35, 45, 40, 23, 4, 3 E: 33.4695240222, 50.2042860333, 37.653214525, 18.82660726252, 7.05997772344, 2.11799331703 χ²: 3.35643422067 |
che posso arrotondare a 3.36
Quanti sono i gradi di libertà?. Abbiamo 6 classi (k=0,...,k=5), un vincolo dovuto alla imposizione che le uscite in tutto siano 150 e un altro vincolo dovuto alla imposizione che la media sia 3/2. Quindi 6-2=4 gradi di libertà. 3.36 corrisponde (vedi sotto) alla mediana, un valore "normalissimo". Non ci sono motivi per rifiutare l'ipotesi che la distribuzione sia effettivamente di Poisson.
d.f. 5 10 25 50 75 90 95
3 0.352 0.584 1.21 2.37 4.11 6.25 7.81
4 0.711 1.06 1.92 3.36 5.39 7.78 9.49
Nei casi in cui in una modalità cadano pochi valori attesi rispetto alle atre può essere conveniente raggruppare più modalità in modo da avere contributi più equilibrati. Nel nostro caso potremmo raggruppare i casi da k=4 a k=5. Otterremmo χ² = 2.5 con una classe in meno, ossia 4-1=3 gradi di libertà. 2.5 corrisponde a circa il 50° percentile (2.37); avremmo potuto trarre la stessa conclusione.
Per altri commenti: Test χ2 neGli Oggetti Matematici
Il calcolo era fattibile agevolmente anche con R.
FrOss <- c(35,45,40,23,4,3) Prob <- dpois(c(0:5), lambda=3/2) # Il calcolo di chi^2: n <- sum(FrOss); sum((FrOss-n*Prob)^2/(n*Prob)) [1] 3.374449 # La distribuzione teorica di chi^2 per 4 gradi di liberta' qchisq(c(2.5,5,10,20,30,50,70,80,90,95,97.5)/100, df=4) [1] 0.4844186 0.7107230 1.0636232 1.6487766 2.1946984 3.3566940 [7] 4.8784330 5.9886167 7.7794403 9.4877290 11.1432868 # 3.37 è vicino al 50º percentile: OK # Ecco come avrei potuto calcolare l'ordine ord trovando la soluzione # di qchisq(ord,df=4) = 3.374449 p <- function(ord) qchisq(ord,df=4)-3.374449; 100*uniroot(p,c(0,0.99999))$root [1] 50.27764 # Ho ritrovato che è il 50º percentile.
Qui trovi una spiegazione di come svolgere i calcoli con R.