In un libretto di "preparazione" ad alcune prove di valutazione
nazionali per il primo anno delle superiori di trovano esercizi come
il seguente; discutilo:
"Misurando sei volte l'ombra che un palo proietta sulla strada si ottengono
le seguenti misure in centimetri:
396 399 398 400 402 404
Calcola la misura media e lo scarto quadratico medio"
[A] 398.9 2.16
[B] 399.8 6.8
[C] 399.8 2.6
[D] 400 −2
È difficile attribuire un senso a questo esercizio, per molti motivi.
Vediamone tre dei principali:
− l'ombra di un palo è molto sfumata, per svariati fattori, e non ha
alcun senso trovarne (e sulla base di sei misure, in una situazione in
cui la lunghezza varia nel tempo, ...) una valutazione al millimetro; questo è quanto dovrebbero
dire dei ragazzi con un minimo di buon senso e a cui la scuola venga fatta
percepire come luogo di crescita del proprio sapere;
− supponendo che le sei misure vengano effettuate in un brevissimo lasso di tempo,
in cui la lunghezza dell'ombra non cambi in modo significativo, c'è da porsi il
problema di che cosa possa essere all'origine di misure così diverse,
che si presume siano effettuate con un nastro misuratore di opportuna portata,
che è uno strumento a bassa sensibilità (potrebbe essere la
ambiguità nel delimitare punto di partenza e punto finale della
lunghezza da misurare);
− il concetto di "scarto quadratico medio" è piuttosto raffinato, e va introdotto
con opportune motivazioni, culturali e tecniche; e non si vede come lo si possa effettuare
al primo anno delle scuole superiori; del resto neanche gli autori di questo libretto non ne hanno
capito natura e ruolo.
Vediamo i calcoli, che svolgiamo solamente per commentare l'esercizio, effettuabili facilmente con una calcolatrice
o con questo semplice script:
mean = 399.8333333333333
median = 399 (399.5)
1^, 3^ quartile, diff.: 398 402 4
sigma = 1.1666666666672212
Insomma, volendo si sarebbero potuti approssimare i dati con
l'intervallo [398, 402], ossia 400±2, contenente il 50% centrale dei dati. Nell'ipotesi
che i dati fossero state misure ad alta sensibilità (ma non è
questo il caso) si sarebbe potuto prendere
399.83±k·1.167, con k pari ad uno o ad un numero superiore
(vedi).
I calcoli svolti con R):
dati <- c(396,399,398,400,402,404) m <- mean(dati); m [1] 399.8333 # sc. quadratico medio s <- sqrt(sum((dati-mean(dati))^2)/length(dati)); s; m-s; m+s [1] 2.608746 [1] 397.2246 [1] 402.4421 # ma si sarebbe dovuto usare l'errore standard: s2 <- s/sqrt(length(dati)-1); s2; m-s2; m+s2 [1] 1.166667 [1] 398.6667 [1] 401 # mediana, 1° e 3° quartile median(dati); quantile(dati,0.25); quantile(dati,0.75) [1] 399.5 25% 398.25 75% 401.5