Qui trovi i dati (diversamente classificati) delle età di morte in Italia verso la fine del XIX secolo e verso l'inizio del XXI. Rappresenta graficamente le due distribuzioni e confrontale con opportuni indicatori numerici. Cerca di capire se le differenze sono dovute al fattore della mortalità infantile. Approfondisci questa analisi confrontando i dati da cui sono stati esclusi i morti con età inferiore ai 5 anni.
Elaboriamo i dati usando del software online. Poi vedremo come farlo con R.
Ecco qui sotto (nella colonna di sinistra) le evidenti diversità della distribuzione dei morti nei due periodi storici e (nella colonna a destra) quelle delle distribuzioni relative ai morti di almeno 5 anni. Dati analoghi sono discussi alla voce indici di posizione e dispersione degli Oggetti Matematici..
I file che hanno generato le precedenti immagini: uno, due, tre, quattro.
I pallini sulla base degli istogrammi rappresentano i valori medi.
La forma dell'istogramma trascurando chi ha meno di 5 anni rimane quasi uguale nel caso del 2006.
Nel caso del 1881-90 cambia forma l'istogramma in relazione
al fatto che gran parte della mortalità è concentrata
nella prima fascia di età (tra 0 e 5 anni), tralasciata nelle elaborazioni a destra.
Anche esculdendo la prima fascia, permangono comunque grosse differenze tra i due periodi.
La diversa distribuzione dell'età di morte non è, dunque,
dovuta ai soli cambiamenti nella mortalità infantile:
è cambiata la mortalità anche nelle altre fasce d'età
in relazione sia all'evoluzione della medicina che, soprattutto, ai
cambiamenti nelle condizioni di vità (alimentazione, sicurezza
nel lavoro,
).
A conferma di queste osservazioni posso calcolare mediana, quartili e distanza interquartile (l'intervallo in cui cade il 50% centrale dei dati). Usiamo questa calcolatrice (mettendo come dati i centri degli intervalli).
(1) n= 7986 median 7.5 1^,3^ quartile, diff.: 2.5 55 52.5 (2) n= 4168 median 55 1^,3^ quartile, diff.: 25 67.55 42.5 (3) n=10001 median 82.5 1^,3^ quartile, diff.: 77.5 92.5 15 (4) n= 9958 median 82.5 1^,3^ quartile, diff.: 77.5 92.5 15
Mediana e distanza interquartile del complesso dei dati e di quelli in cui si trascurano i morti con meno di 5 anni rimangono praticamente uguali nel caso del 2006. Nel caso del 1881-90 la mediana, considerando il complesso dei dati, è molto inferiore alle media mentre, trascurando i morti con meno di 5 anni, scavalca quest'ultima, in relazione al fatto che gran parte della mortalità è concentrata nella prima fascia di età.
Calcoli ed elaborazioni grafiche ottenute con R.
Min. 1st Qu. Median Mean 3rd Qu. Max. Min. 1st Qu. Median Mean 3rd Qu. Max. 0 2.615 7.553 28.190 57.750 100 5 29.95 55.98 51.72 70.74 100 I pallini marroni sono 5° e 95° percentile Il pallino rosso è la media Min. 1st Qu. Median Mean 3rd Qu. Max. Min. 1st Qu. Median Mean 3rd Qu. Max. 0 75.50 83.89 81.13 90.25 110 5 75.63 83.95 81.47 90.28 110 |
source("http://macosa.dima.unige.it/r.R") # morti italiani nel 2006 (ogni 10000) morti1 <- c(43, 5, 6, 16, 23, 26, 28, 37, 56, 88, 141,225,350,518,814,1245,1771,2027,1643, 727, 195,17) # metto gli estremi degli intervalli in un'altra (sono 1 in piu') anni1 <- c(0, 5,10,15,20,25,30,35,40,45, 50,55,60,65,70,75,80,85,90,95, 100,105,110) # morti (in migliaia) per classi di eta` in Italia nel 1881-1890 morti2 <- c(3818,343,303,398,360,384,495,1177,708) anni2 <- c( 0, 5, 10, 20, 30, 40, 50, 60, 75,100) BF=3.5; HF=2.5; istoclas(anni2,morti2) BF=3.5; HF=1.4; altrestat() BF=3.5; HF=2.5; istoclas(anni1,morti1) BF=3.5; HF=1.4; altrestat() # morti nel 2006 (dai 5 anni in su) morti3 <- c( 5, 6, 16, 23, 26, 28, 37, 56, 88, 141,225,350,518,814,1245,1771,2027,1643, 727, 195,17) anni3 <- anni1 # morti nel 1881-1890 (dai 5 anni in su) morti4 <- c( 343,303,398,360,384,495,1177,708) anni4 <- anni2 BF=3.5; HF=2.5; istoclas(anni3,morti3) BF=3.5; HF=1.4; altrestat() BF=3.5; HF=2.5; istoclas(anni4,morti4) BF=3.5; HF=1.4; altrestat()
I pallini sulla base degli istogrammi rappresentano i valori medi.
Anche quelli rossi nei boxplot rappresentano i valori medi mentre quelli marroni sono il 5° e il 95° percentile.
Il box rappresenta il 50% centrale dei dati e il segmento al suo interno è la mediana.
La forma dell'istogramma e gli esiti delle
eleborazioni numeriche, rappresentate nei boxplot, trascurando chi ha meno di 5 anni rimangono quasi uguali nel caso del 2006.
Nel caso del 1881-90 cambia forma l'istogramma e la mediana,
prima molto inferiore alle media, scavalca quest'ultima, in relazione
al fatto che gran parte della mortalità è concentrata
nella prima fascia di età (tra 0 e 5 anni), tralasciata nelle elaborazioni a destra.
Anche esculdendo la prima fascia, permangono comunque grosse differenze tra i due periodi, evidenziate dal fatto che
la distanza interquartile (la larghezza del box) rimane comunque di circa 40 anni,
contro i circa 15 del 2006.
La diversa distribuzione dell'età di morte non è, dunque,
dovuta ai soli cambiamenti nella mortalità infantile:
è cambiata la mortalità anche nelle altre fasce d'età
in relazione sia all'evoluzione della medicina che, soprattutto, ai
cambiamenti nelle condizioni di vità (alimentazione, sicurezza
nel lavoro,
).