Qui trovi i dati (diversamente classificati) delle età di morte in Italia verso la fine del XIX secolo e verso l'inizio del XXI. Rappresenta graficamente le due distribuzioni e confrontale con opportuni indicatori numerici. Cerca di capire se le differenze sono dovute al fattore della mortalità infantile. Approfondisci questa analisi confrontando i dati da cui sono stati esclusi i morti con età inferiore ai 5 anni.

Elaboriamo i dati usando del software online. Poi vedremo come farlo con R.

Ecco qui sotto (nella colonna di sinistra) le evidenti diversità della distribuzione dei morti nei due periodi storici e (nella colonna a destra) quelle delle distribuzioni relative ai morti di almeno 5 anni. Dati analoghi sono discussi alla voce indici di posizione e dispersione degli Oggetti Matematici..


 

I file che hanno generato le precedenti immagini:  uno, due, tre, quattro.

I pallini sulla base degli istogrammi rappresentano i valori medi.  La forma dell'istogramma trascurando chi ha meno di 5 anni rimane quasi uguale nel caso del 2006.  Nel caso del 1881-90 cambia forma l'istogramma in relazione al fatto che gran parte della mortalità è concentrata nella prima fascia di età (tra 0 e 5 anni), tralasciata nelle elaborazioni a destra.
Anche esculdendo la prima fascia, permangono comunque grosse differenze tra i due periodi.
La diversa distribuzione dell'età di morte non è, dunque, dovuta ai soli cambiamenti nella mortalità infantile: è cambiata la mortalità anche nelle altre fasce d'età in relazione sia all'evoluzione della medicina che, soprattutto, ai cambiamenti nelle condizioni di vità (alimentazione, sicurezza nel lavoro, …).

A conferma di queste osservazioni posso calcolare mediana, quartili e distanza interquartile (l'intervallo in cui cade il 50% centrale dei dati). Usiamo questa calcolatrice (mettendo come dati i centri degli intervalli).

(1)  n= 7986  median  7.5  1^,3^ quartile, diff.: 2.5   55      52.5 
(2)  n= 4168  median 55    1^,3^ quartile, diff.: 25    67.55   42.5
(3)  n=10001  median 82.5  1^,3^ quartile, diff.: 77.5  92.5    15 
(4)  n= 9958  median 82.5  1^,3^ quartile, diff.: 77.5  92.5    15

Mediana e distanza interquartile del complesso dei dati e di quelli in cui si trascurano i morti con meno di 5 anni rimangono praticamente uguali nel caso del 2006.  Nel caso del 1881-90 la mediana, considerando il complesso dei dati, è molto inferiore alle media mentre, trascurando i morti con meno di 5 anni, scavalca quest'ultima, in relazione al fatto che gran parte della mortalità è concentrata nella prima fascia di età.


Calcoli ed elaborazioni grafiche ottenute con R.

1881-1890


2006

Min. 1st Qu.  Median  Mean   3rd Qu. Max.    Min. 1st Qu.  Median  Mean  3rd Qu. Max.
0   2.615    7.553   28.190  57.750  100     5    29.95   55.98   51.72   70.74  100
                   I pallini marroni sono 5° e 95° percentile
                          Il pallino rosso è la media 
Min. 1st Qu.  Median  Mean   3rd Qu. Max.    Min. 1st Qu.  Median  Mean  3rd Qu. Max.
0   75.50    83.89   81.13   90.25   110     5    75.63   83.95   81.47   90.28  110

source("http://macosa.dima.unige.it/r.R")
# morti italiani nel 2006 (ogni 10000)
morti1 <- c(43, 5,  6, 16, 23,  26,  28,  37,  56, 88,
          141,225,350,518,814,1245,1771,2027,1643, 727,
          195,17)
# metto gli estremi degli intervalli in un'altra (sono 1 in piu')
anni1 <- c(0, 5,10,15,20,25,30,35,40,45,
          50,55,60,65,70,75,80,85,90,95,
          100,105,110)
# morti (in migliaia) per classi di eta` in Italia nel 1881-1890
morti2 <- c(3818,343,303,398,360,384,495,1177,708)
anni2 <- c(    0,  5, 10, 20, 30, 40, 50,  60, 75,100)
BF=3.5; HF=2.5; istoclas(anni2,morti2)
BF=3.5; HF=1.4; altrestat()
BF=3.5; HF=2.5; istoclas(anni1,morti1)
BF=3.5; HF=1.4; altrestat()
# morti nel 2006 (dai 5 anni in su)
morti3 <- c(    5,  6, 16, 23,  26,  28,  37,  56, 88,
          141,225,350,518,814,1245,1771,2027,1643, 727,
          195,17)
anni3 <- anni1
# morti nel 1881-1890 (dai 5 anni in su)
morti4 <- c(  343,303,398,360,384,495,1177,708)
anni4 <- anni2
BF=3.5; HF=2.5; istoclas(anni3,morti3)
BF=3.5; HF=1.4; altrestat()
BF=3.5; HF=2.5; istoclas(anni4,morti4)
BF=3.5; HF=1.4; altrestat()

I pallini sulla base degli istogrammi rappresentano i valori medi. Anche quelli rossi nei boxplot rappresentano i valori medi mentre quelli marroni sono il 5° e il 95° percentile. Il box rappresenta il 50% centrale dei dati e il segmento al suo interno è la mediana.
La forma dell'istogramma e gli esiti delle eleborazioni numeriche, rappresentate nei boxplot, trascurando chi ha meno di 5 anni rimangono quasi uguali nel caso del 2006.  Nel caso del 1881-90 cambia forma l'istogramma e la mediana, prima molto inferiore alle media, scavalca quest'ultima, in relazione al fatto che gran parte della mortalità è concentrata nella prima fascia di età (tra 0 e 5 anni), tralasciata nelle elaborazioni a destra.
Anche esculdendo la prima fascia, permangono comunque grosse differenze tra i due periodi, evidenziate dal fatto che la distanza interquartile (la larghezza del box) rimane comunque di circa 40 anni, contro i circa 15 del 2006.
La diversa distribuzione dell'età di morte non è, dunque, dovuta ai soli cambiamenti nella mortalità infantile: è cambiata la mortalità anche nelle altre fasce d'età in relazione sia all'evoluzione della medicina che, soprattutto, ai cambiamenti nelle condizioni di vità (alimentazione, sicurezza nel lavoro, …).