Nella tabella a lato sono riportati
in parte dati relativi alla distribuzione delle età di morte degli italiani nel
2006 (i morti ogni 10000 abitanti per classe di età).
Qui puoi trovare, opportunamente codificati, i dati completi. Usando opportuno software, determinane mediana, distanza interquartile, media, varianza e s.q.m., e tracciane l'istogramma. |
|
Usiamo lo script histogram (with tighter rectangles). Introuciamo come dati:
Otteniamo:
Altri calcoli posso realizzarli con lo script pocket calculator:
Con lo script box-plot, con lo stesso input, ottengo:
che sintetizza le informazioni fornite dall'istogramma.
Vediamo come si sarebbe potuto usare R.
# Ricorriamo, per esempio, ad R (vediamo un modo di # procedere; ce ne sono anche altri): # metto le frequenze in una variabile morti1 <- c(43,5,6,16,23,26,28,37,56,88,141,225,350,518,814, 1245,1771,2027,1643,727,195,17) # metto gli estremi sinistri degli intervalli in un'altra anni1 <- c(0,5,10,15,20,25,30,35,40,45,50,55,60,65,70, 75,80,85,90,95,100,105) # prendo i centri degli intervalli anni <- anni1+2.5 # metto gli anni e le frequenze in una variabile morti <- rep(anni, morti1) # faccio l'istogramma delle frequenza hist(morti) # apro una nuova finestra, che poi posso ridimensionare dev.new() # faccio l'istogramma delle densità di frequenza, con una griglia hist(morti,probability=TRUE,col="yellow") abline(h=axTicks(2),lty=3) # la sintesi delle informazioni summary(morti) ## Min. 1st Qu. Median Mean 3rd Qu. Max. ## 2.50 77.50 82.50 81.13 92.50 107.50 # la distanza interquartile IQR(morti) # 15 # La deviazione standard e la varianza: sd(morti); var(morti) ## 14.10391 198.9204 # Tracciamo anche il box-plot dev.new() boxplot(morti,horizontal=TRUE, col="yellow",range=0) # Traccio anche dei pallini per rappresentare 5^ e 95^ percentile points(quantile(morti,0.05),1,pch=20) points(quantile(morti,0.95),1,pch=20)
Stime più precise le potevo ottenere importando la procedura "daticlas.txt" (vedi):
anni <- c(anni1,110) freq <- morti1; interv <- anni source("http://macosa.dima.unige.it/R/daticlas.txt") # Min. 1st Qu. Median Mean 3rd Qu. Max. # 0.00 75.50 83.89 81.13 90.25 110.00 IQR(XxXx); sd(XxXx) # 14.75021 14.1782 dev.new() boxplot(XxXx,horizontal=TRUE,col="yellow",range=0) points(quantile(XxXx,0.05),1,pch=20) points(quantile(XxXx,0.95),1,pch=20)