Nel seguente file sono inseriti i dati relativi ai battiti cardiaci (numero dei battito al minuto) registrati tra gli studenti, maschi e femmine, di un corso universitario. Esamina statisticamente le due sequenze di dati e valutane opportunamente le differenze usando strumenti elementari (percentuali, media, mediana, percentili, ...).

Ecco una possibile rappresentazione ed elaborazione dei dati, realizzata con degli script online. Dopo vedremo come realizzarla con R (ma potrebbe essere realizzata con altri programmi). 

Impieghiamo lo script online boxplot, ottenendo per i maschi:

mean = 70.42105263157895
min = 48   1^ quartile = 62   median = 70   3^ quartile = 74   max = 92
31.8%     18.2%     9.1%     40.9%

e per le femmine:

mean = 76.85714285714286
min = 58   1^ quartile = 66   median = 78   3^ quartile = 86   max = 100
19%     28.6%     19%     33.3%

Questi dati sono in accordo con le statistiche realizzate su ampi campioni, da cui risulta che la pulsazione media maschile (e quella mediana) è di poco superiore ai 70 battiti al minuto e che quella femminile (ed anche la mediana) è di poco superiore ai 75 battiti al minuto.

Posso rappresentare (con lo script boxplot successivo) due rappresentazioni con la stessa scala, mettendo come primo dato 45*0 (inferiore ai due minimi) e come ultimo 105*0 (superiore ai due massimi):

58 60 61 62 62 62 64 66 66 68 68 68 72 72 76 76 78 78 78 78 80 80 82 82 84 84 86 87 88 88 90 94 96 96 100

Come sono stati scelti dal programma mediana, 1º e 3º quartile? Vediamolo nel caso delle femmine. I dati sono 35. C'è un dato che sta esattamente a a metà (il 18º).  35/4 = 8.75; il primo quartile è tra 8º e 9º dato, ossia tra 66 e 66; posso scegliere 66.  35/4*3 = 26.25; il terzo quartile è tra 26º e 27º, ossia tra 84 e 86; a seconda del software viene scelto uno di questi due dati, o un valore intermedio tra essi. Qualche software (come R, fa valutazioni più elaborate). Il nostro script in questo caso sceglie 86.

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42

Volendo con lo script histogram rappresento i dati anche con degli istogrammi:


Ecco una possibile rappresentazione ed elaborazione dei dati, realizzata con R

summary(datim)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  48.00   64.00   70.00   70.42   74.00   92.00 
summary(datif)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  58.00   67.00   78.00   76.86   85.00  100.00
boxplot(datim,datif, horizontal=TRUE, names=c("M","F"))
 
hist(datim,right=FALSE,seq(45,105,5),xlab="",main="",col="yellow")
hist(datif,right=FALSE,add=TRUE, angle=135,density=12)
text(59,14,"M"); text(86,7.5,"F")

[ I dati possono essere inseriti in vari modi. Ad esempio dal file a cui è collegato l'esercizio posso copiare i dati dei maschi in un file di testo che chiamo, ad es., dati.txt; posso poi controllare i dati mediante readLines("dati.txt",n=4) che ne visualizza i primi 4; se il programma non trova il file posso specificare mediante Change dir (dal menu File) dove si trova. Posso a questo punto caricarli con datim <- scan("dati.txt",skip=0) (ho messo skip=0 per indicare che non ci sono da saltare righe: nel file non ho copiato la riga iniziale di commento); mi compare l'indicazione "Read 57 items". Faccio esattemente le stesse cose per i dati delle femmine, che posso copiare nello stesso file al posto dei precedenti; caricati i dati con datif <- scan("dati.txt",skip=0) mi compare "Read 35 items".
Oppure possono essere aggiustati così, e poi copiati e incollati in R:

battitom <- c(64,58,62,66,64,74,84,68,62,76,90,80,92,68,60,62,66,70,68,
              72,70,74,66,70,62,60,72,62,76,68,54,74,74,68,72,68,82,64,
              58,54,70,62,48,76,88,70,90,78,70,90,92,60,72,68,84,74,68)
battitof <- c(96,62,78,82,100,68,96,78,88,62,80,84,61,64,94,60,72,58,
              88,66,84,62,66,80,78,68,72,82,76,87,90,78,68,86,76)
 ]

Per altri commenti: distribuzione, valori medi (2) e percentili neGli Oggetti Matematici.