In uno dei libri di testo più diffusi in Italia (nel 2013) -
Bergamini, Trifone, Barozzi, ed. Zanichelli - prima di un qualunque accenno al concetto di
probabilità, dopo la descrizione solo grafica della curva normale e l'informazione che
il 99.74% di valori che si distribuiscano con un istogramma che tenda ad avere tale forma cadono in un
intervallo centrato nella media e di ampiezza tre volte lo scarto quadratico medio (che nel libro viene
chiamato "deviazione standard"),
si trova:
Nel caso della media l'incertezza è valutata con un indice di variabilità chiamato
errore standard. La formula utilizzata per questo indice è
sx = s/√(n−1) [a lato si spiega che s è usato per le deviazioni
standard di campioni e σ per quelle di popolazioni; qui, per comodità, abbiamo
indicato con x la media, invece di usare una sopralineatura]
Esempio. In un magazzino, per un campione di 60 forme di Parmigiano Reggiano si sono ottenuti,
relativamente al peso in chilogrammi, i seguenti valori: x =21.4, s = 0.987.
Si ha: sx = 0.987/√59 ≈ 0.128.
Se al valore della media campionaria aggiungiamo e togliamo 3 volte l'errore standard otteniamo un intervallo,
detto intervallo di confidenza, che contiene il valore della media con una probabilità
del 99.74%. Nell'esempio precedente l'intervallo di confidenza è (21.02,21.78).
Discuti quanto presentato nel libro.
Evidentemente il libro con "errore standard" non intende
l'errore standard, ma l'"errore standard della media",
ossia σ'/√(n−1), dove σ' è lo scarto quadratico medio, che approssima
l'incognito valore della deviazione standard σ. Parlando di "intervallo di confidenza", poi,
sottointende "al 99.73%" (che, per altro, gli autori pensano sia 99.74%: su ciò torniamo dopo).
Accettiamo questo.
Supponiamo che 21.4 e 0.987 siano valori esatti. Allora potrebbe avere senso considerare
l'intervallo centrato nella media campionaria e di raggio 3σ come quello in cui cade al 99.73002%
la media teorica, ma al 99.73%, non al 99.74%!!! Gli autori (o, meglio, l'esercito di persone che
hanno collaborato alla stesura del libro, che purtroppo ha parti fatte peggio di questa: basta dare una occhiata
al capitolo "insiemi e logica" o a quello "la geometria del piano")
hanno probabilmente ricavato da qualche tavola in cui era riportato l'integrale della gaussiana standard tra 0 e 3
arrotondato a quattro cifre, che è 0.4987 (che moltiplicato per 2 fa 0.9974), mentre il valore a 7 cifre
è 0.4986501!
Ma, ovviamente, i valori sono arrotondati, per cui non ha alcun senso considerare così
tante cifre. Dato che
21.4-3*0.987/sqrt(59) = 21.01451 (che arrtondato a 4 cifre, per altro, fa 21.01, non 21.02) e
21.4+3*0.987/sqrt(59) = 21.78549 (che arrtondato a 4 cifre, per altro, fa 21.79, non 21.78), potremmo prendere
l'intervallo [21.0,21.8].
Ma, a parte questi errori da scuola media inferiore, che senso ha, culturalmente, un
esercizio come questo? Senza aver neanche affrontato il concetto di probabilità, mettendo due
formulette da usare senza dare ad esse alcun significato,
?
Come abbiamo individuato un libro con questo errore? Siamo andati presso un libreria scolastica,
abbiamo chiesto il libro di matematica per il primo anno più venduto, nella stessa mattina abbiamo aperto il libro,
abbiamo guardato l'indice, abbiamo scelto il paragrafo "l'incertezza delle statistiche e l'errore standard"
e abbiamo letto il primo esempio, che è stato l'oggetto di questo esercizio (che abbiamo scritto
subito dopo).
Poi ci siamo messi a leggere altre parti
Errori di questo genere si trovano, naturalmente, non solo in questo libro ma nei libri
di testo più diffusi, da almeno 30 anni, fino, almeno, al 2013. E ci sono genitori che devono
spendere soldi per comprare questi libri!
Per commenti I limiti in probabilità: neGli Oggetti Matematici.