Un gruppo di topi dell'età di un mese viene sottoposto ad una certa dose di radiazioni e viene poi diviso in un gruppo che viene tenuto in ambiente normale e in un altro che viene tenuto in ambiente sterile. Analizza e discuti i seguenti diagrammi, che riportano i giorni di vita dei topi che in seguito morirono di linfoma del timo (i giorni di vita vanno da 159 a 432 in un caso, da 158 a 800 nell'altro).

    ambiente NORMALE
1|59|89|91|98|  |  |  |  |
2|35|45|50|56|61|65|66|80|
3|43|56|83|  |  |  |  |  |
4|03|14|28|32|  |  |  |  |




    ambiente STERILE
1|58|92|93|94|95|  |  |  |  |  |
2|02|12|15|29|30|37|40|44|47|59|
3|01|01|21|37|  |  |  |  |  |  |
4|15|34|44|85|96|  |  |  |  |  |
5|29|37|  |  |  |  |  |  |  |  |
6|24|  |  |  |  |  |  |  |  |  |
7|07|  |  |  |  |  |  |  |  |  |
8|00|  |  |  |  |  |  |  |  |  |

La rappresentazione utilizzata sono diagrammi "stem-and-leaf" (vedi). Dai diagrammi si capisce che la media del primo campione è inferiore di quella del secondo. Eseguendo i calcoli ottengo che esse sono 292 e 344. Le mediane sono in un caso il 10º dato, 265, e nell'altro il 19º, 259. Le mediane, quindi, a differenza delle medie, sono molto vicine (anzi, con ordine invertito).  Se ci limitassimo a considerare le medie potremmo essere tentati di concludere che l'ambiente sterile ha allungato di molto la vita dei topi, se consideriamo anche le mediane possiamo mettere in discussione questa conclusione: sono i 5 valori maggiori di 500 che fanno aumentare la media, mentre la mediana non muterebbe se li sostituissimmo tutti con valori intorno a 300.  Occorre approfondire l'indagine piuttosto che affidarsi a facili conclusioni basati sul calcolo dei valori medi.

  Per altri commenti: valori medi (1) neGli Oggetti Matematici.


Calcoli e grafici sono facilmente realizzabili col software online WolframAlpha: vedi:

stem and leaf plot 159,189,191,198,235,245,250,256,261,265,266,280,343,356,383,403,414,428,432
o, meglio:
statistics (159,189,191,198,235,245,250,256,261,265,266,280,343,356,383,403,414,428,432)
statistics (158,192,193,194,195,202,212,215,229,230,237,240,244,247,259, 301,301,321,337,415,434,444,485,496, 529,537,624,707,800)

# Calcoli e rappresentazioni con R (vedi)
an = c( 100+c(59,89,91,98),200+c(35,45,50,56,61,65,66,80), 300+c(43,56,83),
        400+c(3,14,28,32) )
as = c( 100+c(58,92,93,94,95),200+c(2,12,15,29,30,37,40,44,47,59),
        300+c(1,1,21,37),400+c(15,34,44,85,96),500+c(29,37),624,707,800 )
stem(an)
#  The decimal point is 2 digit(s) to the right of the |
#  1 | 699
#  2 | 045566778
#  3 | 468
#  4 | 0133
mean(an); median(an)
# 292.3158  265
stem(as)
#  The decimal point is 2 digit(s) to the right of the |
#  1 | 6999
#  2 | 00123344456
#  3 | 0024
#  4 | 2349
#  5 | 034
#  6 | 2
#  7 | 1
#  8 | 0
mean(as); median(as)
# 344.069   259

Potremmo tracciare grafici e fare calcoli anche, direttamente, con questo semplice script:

A = 100 B = 500 intervals = 4 their width = 100
n=19 min=159 max=432 median=265 mean=292.3157894736842
159,189,191,198,235,245,250,256,261,265,266,280,343,356,383,403,414,428,432

A = 100 B = 900 intervals = 8 their width = 100 n=29 min=158 max=800 median=259 mean=344.0689655172414 158,192,193,194,195,202,212,215,229,230,237,240,244,247,259,301,301,321,337,415,434,444,485,496,529,537,624,707,800