Un'indagine sul peso dei maschi tra i 45 e i 55 anni di un certo stato dà i seguenti esiti (a sinistra gli intervalli di peso in kg - [53.5, 60.5) rappresenta i pesi che arrotondati vanno da 54 a 60 -, a destra le frequenze assolute):
[53.5, 60.5)   4     [60.5, 67.5)   39     [67.5,74.5) 122
[74.5, 81.5) 197   [81.5, 88.5) 192     [88.5, 95.5) 126
[95.5, 102.5) 93   [102.5, 109.5) 33   [109.5, 116.5) 16
[116.5, 123.5) 2   [123.5, 130.5)  1
Questi 825 rilevamenti hanno media 84.30 e scarto quadratico medio (campionario) 11.5. Suppongo che i pesi abbiano distribuzione normale avente tali valori come media e scarto quadratico medio (vedi figura a lato) e ottengo 29.3 come χ².
 
(1) Quanti sono i gradi di libertà?  (2) Devo rifiutare l'ipotesi che la distribuzione sia normale?
  (A) 10,no   (B) 9,no   (C) 8,no   (D) 7,no
  (E) 10,sì    (F) 9,sì   (G) 8,sì   (H) 7,sì
(3) Se i dati fossero stati 1650, con la stessa distribuzione, avrei ottenuto un valore χ² diverso?
  (A) no   (B) non abbiamo informazioni sufficienti per stabilirlo
  (C) doppio   (D) quadruplo   (E) metà   (F) un quarto

(1), (2).  11 intervalli e 3 vincoli:  1) la somma delle frequenze relative è 1,  2) la media e  3)  la varianza sono date.  Dunque i gradi di libertà sono 11-3 = 8.
Vedi il test χ2  neGli Oggetti Matematici.

d.f.     5       10      25      50      75      90      95 
1       0.00393 0.0158  0.102   0.455   1.32    2.71    3.84
2       0.103   0.211   0.575   1.39    2.77    4.61    5.99
3       0.352   0.584   1.21    2.37    4.11    6.25    7.81
4       0.711   1.06    1.92    3.36    5.39    7.78    9.49
5       1.15    1.61    2.67    4.35    6.63    9.24    11.1
6       1.64    2.20    3.45    5.35    7.84    10.6    12.6
8       2.73    3.49    5.07    7.34    10.2    13.4    15.5

Il valore 29.3 è ben oltre il percentile di ordine 95 (15.5): l'ipotesi deve essere decisamente rigettata (risposta G).

(3).  È chiaro che se con più prove l'istogramma avesse avuto la stessa "distanza" dalla densità teorica ciò significherebbe che l'adattamento è peggiore (con più dati l'approssimazione dovrebbe migliorare). Quindi sicuramente χ2 è maggiore. Doppio o quadruplo? Dall'esame di  Σ(FreqOssi–FreqAtti)2/FreqAtti  ho subito che, al raddoppiare delle frequenze, il denominatore si moltiplica per 22 e il numeratore per 2, per cui complessivamente si ha una moltiplicazione per 2 (risposta C).

Se i dati fossero stati, invece, 200, ossia circa 1/4 di quelli del quesito, avrei ottenuto circa χ2 = 7, attorno al 50º percentile. Non avrei, dunque, scartato l'ipotesi della normalità (anche se noi sappiamo - limiti in probabilità - che i pesi non hanno andamento gaussiano).


Vediamo come è ottenibile l'istogramma con questo script:

57*4,64*39,71*122,78*197,85*192,92*126,99*93,106*33,113*16,120*2,127*1

A = 53.5   B = 130.5   intervals = 11   their width = 7
n=825  min=57  max=127  median=85  1^|3^ quartile=78|92  mean=84.29575757575758
%:  | 0.48 | 4.73 | 14.79 | 23.88 | 23.27 | 15.27 | 11.27 | 4 | 1.94 | 0.24 | 0.12 |

Con questa calcolatrice e lo stesso input ottengo la deviazione standard (sc. quadratico medio campionario) 11.512120836524915, arrotondabile con 11.5:

Posso fare il grafico della gaussiana col software online WolframAlpha:

plot y=exp(-((x-m)/s)^2/2)/(sqrt(2*PI)*s), for s=11.5, m=84.2957 from x=50 to 140

 

Ho sovrapposto grafico e istogramma usando Paint, anche per scalare l'immagine dell'istogramma (ma si potrebbe usare una qualunque applicazione grafica). Questo è il procedimento più facile. Sarebbe facile anche utilizzare uno script: vedi.

Come è stato calcolato χ² ?   Con WolframAlpha:

exp(-((x-84.2957)/11.5)^2/2)/(sqrt(2*PI)*11.5), where x=57, 64, 71, 78, 85, 92, 99, 106, 113, 120, 127
0.0020743, 0.0073092, 0.017781, 0.0298629, 0.0346256, 0.0277174, 0.0153178, 0.00584427, 0.00153941, 0.00027994, 0.0000351453

Con lo script test χ2: