Di un cavo di gomma prodotto industrialmente sono stati esaminati tratti consecutivi lunghi ciascuno 100 m e si sono individuati quanti sono i difetti in ciascuno di essi. Si è ottenuta la seguente distribuzione
numero difetti
riscontrati
  0     1     2     3     4     5  
numero tratti con
tale numero di difetti
 35    45    40    23     4     3  
Calcola le frequenze attese secondo la legge di Poisson con la stessa media di questa distribuzione e valuta (con un test χ2) la possiblità di approssimare la distribuzione con tale legge.

Le osservazioni sono 150. Il numero medio di difetti per tratto è 225/150 = 3/2.
La legge di Poisson è dunque Pr(N=k) = (3/2)kexp(-3/2)/k!.
Il numero atteso di tratti con k difetti è Pr(N=k)·150.
Possiamo calcolare χ2 con una calcolatrice, un foglio di calcolo o (meglio) con altro software (come vedremo più avanti). Ecco come trovarlo con un foglio di calcolo; qui sotto sono indicate le formule inserite nelle celle della riga 2 e poi copiate in basso; le formule sono quelle nel caso in cui il foglio di calcolo sia impostato in lingua italiana.
B2:   =(3/2)^A2*EXP(-3/2)/FATTORIALE(A2)
C2:   =B2*150
E2:   =(D2-C2)^2/C2
F2:   =SOMMA(E2:E7)
Nella colonna osservati sono state inserite le frequenze osservate.

ABCDEF
 1   K  Pr(N=k) Attesi Osservati (Os-At)^2/At χ2
2 0 0.2231 33.4695 35 0.0700 3.37
3 1 0.3347 50.2043 45 0.5395
4 2 0.2510 37.6532 40 0.1463
5 3 0.1255 18.8266 23 0.9251
6 4 0.0471 7.0600 4 1.3263
7 5 0.0141 2.1180 3 0.3673

Vediamo come procedere con degli script online. Con questa calcolatrice ottengo i valori attesi:

pow( 3/2, 0)*exp(-3/2) / (1)*150 = 33.46952402226447
pow( 3/2, 1)*exp(-3/2) / (1)*150 = 50.20428603339671
pow( 3/2, 2)*exp(-3/2) / (1*2)*150 = 37.65321452504753
pow( 3/2, 3)*exp(-3/2) / (1*2*3)*150 = 18.826607262523765
pow( 3/2, 4)*exp(-3/2) / (1*2*3*4)*150 = 7.059977723446412
pow( 3/2, 5)*exp(-3/2) / (1*2*3*4*5)*150 = 2.117993317033924

che posso arrotondare: 33.47, 50.20, 37.65, 18.83, 7.06, 2.12

Poi con quest'altro script online (vedi) ottengo:

O:  35, 45, 40, 23, 4, 3
E:  33.4695240222, 50.2042860333, 37.653214525, 18.82660726252, 7.05997772344, 2.11799331703
χ²:  3.35643422067

che posso arrotondare a  3.36

Quanti sono i gradi di libertà?. Abbiamo 6 classi (k=0,...,k=5), un vincolo dovuto alla imposizione che le uscite in tutto siano 150 e un altro vincolo dovuto alla imposizione che la media sia 3/2. Quindi 6-2=4 gradi di libertà.  3.36 corrisponde (vedi sotto) alla mediana, un valore "normalissimo". Non ci sono motivi per rifiutare l'ipotesi che la distribuzione sia effettivamente di Poisson.

d.f.     5       10      25      50      75      90      95 
3       0.352   0.584   1.21    2.37    4.11    6.25    7.81
4       0.711   1.06    1.92    3.36    5.39    7.78    9.49

Nei casi in cui in una modalità cadano pochi valori attesi rispetto alle atre può essere conveniente raggruppare più modalità in modo da avere contributi più equilibrati. Nel nostro caso potremmo raggruppare i casi da k=4 a k=5. Otterremmo χ² = 2.5 con una classe in meno, ossia 4-1=3 gradi di libertà. 2.5 corrisponde a circa il 50° percentile (2.37); avremmo potuto trarre la stessa conclusione.

Per altri commenti: Test χ2 neGli Oggetti Matematici

Il calcolo era fattibile agevolmente anche con R.

FrOss <- c(35,45,40,23,4,3)
Prob <- dpois(c(0:5), lambda=3/2)
# Il calcolo di chi^2:
n <- sum(FrOss); sum((FrOss-n*Prob)^2/(n*Prob))
[1] 3.374449
# La distribuzione teorica di chi^2 per 4 gradi di liberta'
qchisq(c(2.5,5,10,20,30,50,70,80,90,95,97.5)/100, df=4)
[1]  0.4844186  0.7107230  1.0636232  1.6487766  2.1946984  3.3566940
[7]  4.8784330  5.9886167  7.7794403  9.4877290 11.1432868
# 3.37 è vicino al 50º percentile: OK
# Ecco come avrei potuto calcolare l'ordine ord trovando la soluzione
# di  qchisq(ord,df=4) = 3.374449
p <- function(ord) qchisq(ord,df=4)-3.374449; 100*uniroot(p,c(0,0.99999))$root
[1] 50.27764
# Ho ritrovato che è il 50º percentile.

Qui trovi una spiegazione di come svolgere i calcoli con R.