Qui trovi i dati (arrotondati) relativi alle altezze e ai pesi di un gruppo di alunni maschi di 2ª media di una scuola della provincia di Genova. Analizzali statisticamente (eventualmente con del software).

Elaboriamo i dati usando del software online. Poi vedremo come farlo con R.  Tracciamo innanzi tutto i relativi istogrammi usando questo script:


A = 135  B = 175             A = 25  B = 80

 

A = 135   B = 175   intervals = 8   their width = 5
n=85   min=136.5   max=171 median=152   1^|3^ quartile=146.5|156   mean=152.1529411764706
 
A = 25   B = 80   intervals = 11   their width = 5
n=85   min=27.3   max=79.3   median=43.4   1^|3^ quartile=37.5|51   mean=45.02235294117647

Si capisce immediatamente che l'andamento dei pesi ha una "coda" al crescere dei valori.  Quello delle altezze sembra non avere code né al crescere né al decrescere dei valori.

Più avanti vedrai che l'istogramma della distribuzione delle altezze può essere approssimato da quello di una opportuna curva simmetrica rispetto alla retta verticale avente per ascissa la media:

Se vuoi,  qui  puoi esaminare lo script con cui è stata realizzata l'immagine precedente (la curva è una "gaussiana").

Il valore di "sd" (standard deviation) che compare nello script è la distanza in orizzontale dei punti in cui la curva cambia concavità dal vertice della curva (ossia dalla retta verticale passante per la media); esso è stato determinato con la nostra calcolatrce introducendo come "data" le nostre altezze:


n=85   mean=152.1529411764706   experimental standard dev. = 6.900665741439063
 

length(altezze)
    85
summary(altezze)
  Min.  1st Qu. Median  Mean 3rd Qu. Max.
  136.5  147.0  152.0  152.2  156.0  171.0
hist(altezze,right=FALSE)
abline(h=seq(5,25,5),lty=3)
hist(altezze,right=FALSE,probability=TRUE)
abline(h=seq(0.01,0.06,0.01),lty=3)

length(pesi)
    85
summary(pesi)
  Min.  1st Qu. Median  Mean 3rd Qu. Max.
  27.30  37.80  43.4  45.02  51.00  79.30
hist(pesi,right=FALSE)
abline(h=seq(5,20,5),lty=3)
hist(pesi,right=FALSE,probability=TRUE)
abline(h=seq(0.01,0.05,0.01),lty=3)

[La scala verticale delle densità di frequenza è scelta in modo che l'area dell'istogramma sia 1: alla frequenza di 25 altezze corrisponde una densità di frequenza di 25/85/5 = 5/85 = 1/17 = 0.0588... (25/85 è la frequenza relativa, 5 è l'ampiezza dell'intervallino)]

Più avanti vedrai che l'istogramma della distribuzione delle altezze può essere approssimato da quello di una opportuna curva simmetrica rispetto alla retta verticale avente per ascissa la media:
hist(altezze,right=FALSE,probability=TRUE,col="yellow") 
abline(h=seq(0,0.06,0.01),lty=3)
z <- function(x) dnorm(x, mean=mean(pesi), sd=sd(altezze)); curve(z,add=TRUE)
abline(v=mean(pesi),lty=3)