Nel seguente file sono inseriti i dati relativi al peso in chilogrammi degli studenti maschi di un corso universitario. Esamina statisticamente i dati usando strumenti elementari (percentuali, media, mediana, percentili, ...).

Supponiamo che i dati siano arrotondati (se no dovremmo aggiungere 1/2).  Ecco una possibile rappresentazione ed elaborazione dei (57) dati, realizzata con software online WolframAlpha. Sotto vedremo come potrebbe essere realizzata con R (ma si potrebbe ricorrere ad altri programmi).

Impieghiamo lo script online boxplot, ottenendo:

mean = 71.7719298245614
min = 56   1^ quartile = 66   median = 70   3^ quartile = 77   max = 97
24.4%     9.8%     17.1%     48.8%

Già questa elaborazione mette in luce che la distribuzione dei pesi non è simmetrica, ma ha una coda verso destra.  Facciamo anche l'istogramma, con lo script histogram:

L'istogramma (con due diverse scelte delle classi) conferma le deduzioni fatte sulla base del box-plot.

Per altri commenti: distribuzione, valori medi (2) e percentili neGli Oggetti Matematici.


Ecco una rappresentazione ed elaborazione realizzata con R.

length(peso)
  57
stem(peso)
  5 | 699
  6 | 11234444
  6 | 6666788888889
  7 | 0000000000133334
  7 | 57777
  8 | 001224
  8 | 66668
  9 | 
  9 | 7
summary(peso)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  56.00   66.00   70.00   71.77   77.00   97.00
boxplot(peso,horizontal=TRUE)
# diversi istogrammi, in intervalli scelti automaticamemte,
# in intervalli scelti da noi, rappresentando le densità:

hist(peso,right=FALSE,xlab="",main="",col="yellow")
hist(peso,right=FALSE,seq(56,100,4),xlab="",main="",col="yellow")
hist(peso,right=FALSE,seq(56,100,4),xlab="",main="",col="yellow",probability=TRUE)
abline(h=5/100,lty=3,col="grey50"); text(77,5/100,"5%")

[ I dati possono essere inseriti in vari modi. Ad esempio dal file a cui è collegato l'esercizio posso copiare i dati in un file di testo che chiamo, ad es., dati.txt; posso poi controllare i dati mediante readLines("dati.txt",n=4) che ne visualizza i primi 4; se il programma non trova il file posso specificare mediante Change dir (dal menu File) dove si trova. Posso a questo punto caricarli con peso <- scan("dati.txt",skip=0) (se avessi copiato anche la riga iniziale di commento dovrei mettere skip=1) ]


Ecco una elaborazione realizzata con Stat (la scala verticale rappresenta le frequenze relative, ossia le densità di frequenza moltiplicate per le ampiezze degli intrevalli: al 5% del grafico precedente corrisponde il 5%·4 = 20%):

57 dati in 57 righe  min,max: 56,97
media: 71.7719298  mediana: 70   25% :66   75% :77
 ....|-------|====|========|----------|.............
+------------------------------------------------------+
55                                                   100