Nella tabella a lato sono riportati gli esiti dei rilevamenti della pressione arteriosa massima in un gruppo di maschi quarantenni (nella colonna 1 i valori, nella 2 le frequenze assolute).
I dati sono espressi in millimetri di mercurio (mm Hg) e arrotondati alle cinquine. Determinane (usando al più una calcolatrice non programmabile) mediana, distanza interquartile, media, varianza e s.q.m.. Controlla eventualmente i risultati utilizzando opportuno software. |
|
Dalla tabella con le frequenze ricavo quella con le frequenze cumulate: → I dati sono 135. Al centro vi è il dato di posto (1+135)/2 = 68. I dati dal 65° all'83° valgono, arrotondati alle cinquine, 140. Posso assumere questa come arrotondamento alle cinquine della mediana. Volendo ![]() la mediana cade nell'intervallo [137.5,142.5), ampio 5, in cui cadono 19 dati. 64 sono i dati caduti negli intervalli precedenti. Il segmento verticale che taglia a metà l'istogramma ha ascissa ha da 137.5 una distanza che corrisponde a quanti dati da 64 mancano per arrivare al 50% di 135. La scala per passare dalle distanze in dati a quella in pressioni è 5/19. Quindi come mediana prendo: 137.5+(50%·135-64)·5/19 = 137.5+3.5·5/19 = 138.42 = 138. |
| ||||||||||||||||||||||||||||||||||||||
![]() |
135/4 = 33.75; quindi il 25° percentile (primo quartile) sta tra i dati di posto 28 e 43, e corrisponde quindi a 130
(arrotondamento alle cinquine).
135·3/4 = 101.25 quindi il 75° percentile sta tra i dati di posto 97 e 110, e corrisponde quindi a 150 (arrotondamento alle cinquine).
La distanza interquartile (IQR) è quindi 150-130 = 20
(valore arrotondato alle decine: facendo la differenza le precisioni si sommano).
Posso stimare meglio il valore riferendomi agli intervalli.
127.5+(25%·135-28)·5/(43-28) = 137.5+5.75·5/15 =129.41
;
147.5+(25%·135-97)·5/(110-97) = 149.13
; 149.13-129.41 = 20 (arrotondando alle unità).
Quindi il 20 trovato prima ha una precisione migliore della decina.
Per il calcolo della media posso usare una calcolatrice tascabile (impiegando ad es. ![]() Se non dispongo di una c.t. posso procedere associando a ogni intervallo un numero intero, come illustrato nella tabella a destra. In pratica ho assegnato 0 ad un intervallo abbastanza centrale e ho numerato gli intervalli precedenti e successivi a partire da esso. Poi calcolo la media riferendomi a questi valori interi, su cui è facile operare in quanto sono "numeri piccoli" e con segni diversi, il che consente di operare varie semplificazioni (qui descritte per esteso, ma in gran parte eseguibili a mente): |
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1*(-9)+1*(-8)+2*(-7)+3*(-6)+5*(-5)+
+4*5+3*6+3*7+2*8 = 1*(-9)+1*(-8)+2*8+2*(-7)+3*7+3*(-6)+3*6+5*(-5)+4*5+ = 1*(-9)+1*8+1*7+0*6+1*(-5)+1*(-4)+2*(-3)+2*(-2)+7*(-1)+0*19 = -9+8+7-5-4-6-4-7 = -20 La media riferita ai dati così trasformati è -20 / 135 Quella riferita ai dati originali la ottengo moltiplicando per l'ampiezza degli intervallini e aggiungendo 140: -20 / 135 * 5 + 140 = 140 - 100/135. Formalizzando, chiamata X la distribuzione originale, il procedimento usato è stato quello di considerare (X-140)/5 e usare le proprietà ![]() | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ottengo: 139.2592
che arrotondo a 139 (o 139.3: ![]() |
Per trovare lo s.q.m. della nostra distribuzione X (σ(X)) posso calcolarlo direttamente usando la definizione, ossia calcolare la media dei quadrati degli scarti (Var(X)) e farne la radice quadrata,
oppure, nel calcolo a mano o con una calcolatrice non sofisticata, usare la proprietà:
Ecco il controllo dei risultati con il programma R
Ovvero con questo script:
A = 92.5 B = 182.5 intervals = 18 their width = 5
n=135 min=95 max=180 median=140 1^|3^ quartile=130|150 mean=139.25925925925927
95, 100,105*2, 110*3, 115*5, 120*6, 125*10, 130*15, 135*21, 140*19, 145*14, 150*13, 155*8, 160*5, 165*4, 170*3, 175*3, 180*2