In un libro per la scuola secondaria di 1º grado viene riportato l'istogramma B relativo alla distribuzione per età della popolazione in una certa città italiana nel 1970, in cui gli abitanti con meno di 15 anni erano il 18%, quelli col almeno 15 anni e meno di 25 il 16.5%, quelli con almeno 25 e meno di 55 il 50%, quelli con almeno 55 e meno di 65 il 10%, quelli con almeno 65 il 5.5%.  Sono riprodotte anche altre due rappresentazioni grafiche della stessa distribuzione.  Una delle tre rappresentazioni non è corretta?  Quale?  Perché?

Per rispondere, prima di fare ragionamenti troppo complicati, dobbiamo pensare al fenomeno che si vuole rappresentare.  Ci si aspetta che la popolazione con un'età avanzata sia molto meno di quella giovane, e che quella con età molto bassa non sia in quantità molto diversa da quella giovane.  Pensando a questo sembrerebbe che la forma dell'istogramma C corrisponda meglio al fenomeno.
Osservando meglio le tre rappresentazioni ci accorgiamo che mentre B e C rappresentano i vari intervalli di età proporzionalemnte alle loro ampiezze, A li rappresenta con basi di eguale ampiezza;  possiamo dedurre che A e B, che hanno colonne di eguale altezza, siano tra loro incompatibili.  Ci sembra di poter concludere che almeno C è corretta.  Ma B e C hanno le basi uguali, quindi non può essere corretta anche B.  In defintiva sembrerebbe che A e C siano rappresentazioni corrette, anche se diverse, del fenomeno.  Riflettiamo, ora, in modo più attento agli aspetti matematici.

Ciò che rappresenta la quantità dei dati riferiti alle varie classi è l'area delle diverse colonnine, non la loro altezza, se le colonnine hanno basi diverse.  Si intuisce subito che la rappresentazione B non può essere corretta: la colonna corrispondente alle età comprese nell'intervallo [25,55), in cui stanno il 50% degli abitanti, non ha area uguale alla somma delle aree delle altre colonne;  la cosa invece torna nel caso della rappresentazione A e si intuisce che possa valere anche nel caso della rappresentazione C.

Errori di questo tipo sono molto frequenti nei libri di testo e in materiali didattici per la scuola media. Questo è tratto da un libro che non è dei peggiori (per questo non lo citiamo).  Per eventuali approfondimenti vedi qui.


# Sotto calcoli e grafici fatti con R (vedi).
source("http://macosa.dima.unige.it/r.R")
BF=2.5; HF=2
# l'istogramma "corretto"
interv = c(0, 15, 25, 55, 65, 100)
freq = c(18, 16.5, 50, 10, 5.5)
noMean=1; histoclass(interv,freq)
# il diagramma a barre
names=c("<15","<25","<55","<65",">=65")
BarNames=names; BarC(freq,"grey")
# il grafico "errato"
freq2 = c(18*15, 16.5*10, 50*30, 10*10, 5.5*35)
noMean=1; histoclass(interv,freq2)
#
# metti  noGrid=1  prima di histoclass o BarC se non vuoi la griglia

Gli istogrammi possono essere fatti anche direttamente in Html, usando JavaScript, come il seguente:  vedi

o con WolframAlpha (vedi gli esempi):


Invece che ricorrere allo script precedente, si può ricorrere ad uno script standard per tracciare istrogrammi con basi eguali come questo, suddividendo gli intervalli [0,15), [15,25), [25,55), … in modo che ciascuno sia costituito da intervallini di eguale ampiezza; si ottengono istogrammi come il seguente:

Questo istogramma è stato realizzato introducendo i seguenti dati:
2.5*600, 7.5*600, 12.5*600, 17.5*825, 22.5*825, 27.5*833, 32.5*833, 37.5*833, 42.5*833, 47.5*833, 52.5*833, 57.5*500, 62.5*500, 67.5*79, 72.5*79, 77.5*79, 82.5*79, 87.5*79, 92.5*79, 97.5*79