In una grande scuola superiore all'ultimo anno vengono raccolti i dati sulle altezze dei 217 maschi e vengono rappresentati da tre diverse classi con degli istogrammi.  Ecco come sono stati classificati i dati (h altesse in cm, N numero dei ragazzi) e i relativi istogrammi.  Le rappresentazioni grafiche sono tutte corrette?  Perché?
 150 ≤ h < 165, N=26; 165 ≤ h < 170, N=43; 170 ≤ h < 175, N=65; 175 ≤ h < 180, N=51; 180 ≤ h < 200, N=32.

Osservando le tre rappresentazioni ci accorgiamo che mentre la 2ª e la 3ª rappresentano i vari intervalli di età proporzionalemnte alle loro ampiezze, la 1ª li rappresenta con basi di eguale ampiezza;  possiamo dedurre che il 1º e il 2º, che hanno colonne di eguale altezza, siano tra loro incompatibili.  Ci sembra di poter concludere che almeno la 3ª è corretta.  Ma la 2ª e la 3ª hanno le basi uguali, quindi non può essere corretta anche la 2ª.  In defintiva sembrerebbe che la 1ª e la 3ª siano rappresentazioni corrette, anche se diverse, del fenomeno.  Riflettiamo, ora, in modo più attento.

Ciò che rappresenta la quantità dei dati riferiti alle varie classi è l'area delle diverse colonnine, non la loro altezza, se le colonnine hanno basi diverse.  Si intuisce subito che la 2ª rappresentazione non può essere corretta: la colonna corrispondente all'ultimo intervallo, in cui stanno 32 alunni, ha area molto maggiore di quella della penultima colonna, che rappresenta 51 alunni.  Il 1º grafico rappresenta tutte le classi con basi di eguale ampiezza ma con area proporzionale alle varie frequenze.  Ma non è un istogramma corretto, in quanto gli intervalli di base non sono proporzionali alle loro ampiezze. Se ci rendiamo conto si questo fatto possiamo riuscire a capire quali sono le diverse entità che vengono raffigurate, ma la rappresentazione induce ad una valutazione scorretta di come sono distribuite.

Per eventuali approfondimenti vedi qui.


# Sotto i calcoli fatti con R (vedi).
source("http://macosa.dima.unige.it/r.R")
BF=3.5; HF=2.5
# l'istogramma "corretto"
interv = c(150, 165, 170, 175, 180, 200)
freq =    c(26, 43, 65, 51, 32)
noGrid=1; noMean=1; histoclas(interv,freq)
# il diagramma a barre (con le classi descritte correttamente)
names=c("<165","<170","<175","<180",">=180")
noGrid=1; BarNames=names; BarC(freq,"grey")
# il grafico "errato"
freq2 = c(26*15, 43*5, 65*5, 51*5, 32*20)
noGrid=1; noMean=1; histoclass(interv,freq2)


Gli istogrammi possono essere fatti anche direttamente in Html, usando JavaScript vedi

o con WolframAlpha (vedi gli esempi):


plot (0;0),(0;26/15),(15;26/15),(15;0), (15;43/5),(20;43/5),(20,0), (20;65/5),(25;65/5),(25,0), (25;51/5),(30;51/5),(30,0), (30;32/20),(50;32/20),(50;0),(0;0)