Nella tabella a lato sono riportati in parte dati relativi alla distribuzione delle età di morte degli italiani nel 2006 (i morti ogni 10000 abitanti per classe di età).  Qui puoi trovare, opportunamente codificati, i dati completi.
Usando opportuno software, determinane mediana, distanza interquartile, media, varianza e s.q.m., e tracciane l'istogramma.
[0,5)43
[5,105
[10,156
[15,20)16
[105,110)17

Usiamo lo script histogram (with tighter rectangles). Introuciamo come dati:

2.5*43, 7.5*5, 12.5*6, 17.5*16, 22.5*23, 27.5*26, 32.5*28, 37.5*37, 42.5*56, 47.5*88, 52.5*141, 57.5*225, 62.5*350, 67.5*518, 72.5*814, 77.5*1245, 82.5*1771, 87.5*2027, 92.5*1643, 97.5*727, 102.5*195, 107.5*17

Otteniamo:

A = 0   B = 110   intervals = 22   their width = 5
n=10001   min=2.5   max=107.5   median=82.5   1^|3^ quartile=77.5|92.5   diff.=15   mean=81.13363663633636

Altri calcoli posso realizzarli con lo script pocket calculator:

scarto quad. medio (sq.root of var./theoret.st.dev.) = 14.103207947701545
variance = 198.90047441611205

Con lo script box-plot, con lo stesso input, ottengo:

che sintetizza le informazioni fornite dall'istogramma.


Vediamo come si sarebbe potuto usare R.

   
# Ricorriamo, per esempio, ad R (vediamo un modo di
# procedere; ce ne sono anche altri):
# metto le frequenze in una variabile
morti1 <- c(43,5,6,16,23,26,28,37,56,88,141,225,350,518,814,
            1245,1771,2027,1643,727,195,17)
# metto gli estremi sinistri degli intervalli in un'altra
anni1 <- c(0,5,10,15,20,25,30,35,40,45,50,55,60,65,70,
           75,80,85,90,95,100,105)
# prendo i centri degli intervalli
anni <- anni1+2.5
# metto gli anni e le frequenze in una variabile
morti <- rep(anni, morti1)
# faccio l'istogramma delle frequenza
hist(morti)
# apro una nuova finestra, che poi posso ridimensionare
dev.new()
# faccio l'istogramma delle densità di frequenza, con una griglia
hist(morti,probability=TRUE,col="yellow")
abline(h=axTicks(2),lty=3)
# la sintesi delle informazioni
summary(morti)
##  Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  2.50   77.50   82.50   81.13   92.50  107.50
# la distanza interquartile
IQR(morti)
#  15
# La deviazione standard e la varianza:
sd(morti); var(morti)
## 14.10391  198.9204
# Tracciamo anche il box-plot
dev.new()
boxplot(morti,horizontal=TRUE, col="yellow",range=0)
# Traccio anche dei pallini per rappresentare 5^ e 95^ percentile
points(quantile(morti,0.05),1,pch=20)
points(quantile(morti,0.95),1,pch=20)

Stime più precise le potevo ottenere importando la procedura "daticlas.txt" (vedi):

anni <- c(anni1,110)
freq <- morti1; interv <- anni
source("http://macosa.dima.unige.it/R/daticlas.txt")
#   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#   0.00   75.50   83.89   81.13   90.25  110.00 
IQR(XxXx); sd(XxXx)
#  14.75021  14.1782
dev.new()
boxplot(XxXx,horizontal=TRUE,col="yellow",range=0)
points(quantile(XxXx,0.05),1,pch=20)
points(quantile(XxXx,0.95),1,pch=20)