Il diagramma a lato, relativo ad un paese in cui la moneta è il Din, rappresenta, arrotondato alle centinaia, lo stipendio annuale di 42 ingegneri neolaureati; il valore minimo è 268; e il massimo è 403. Quali sono gli intervalli in cui sono stati classificati i dati? Rappresenta le informazioni con un box-plot e sintetizzale indicando opportunamente l'intervallo in cui cade il 50% centrale dei dati (se vuoi, qui trovi elencati i dati rappresentati a lato). |
|
I dati sono classificati in intervalli di eguale ampiezza. Essendo 4 le classi in cui sono suddivisi i dati inzianti per 3, ossia che stanno in [300,400), le classi in cui sono classificati sono [250,275), [275,300), [300,325), [325,350), [350,375), [375,400), [400,425). I dati sono 42.
2|68|68|70|70|73|74|74| 2|75|77|79| 3|01|03|03|04|04|10|11|11|13|14|17|19|21|22| 3|25|27|27|27|29|29|40|41|41|44| 3|62|62|70|73|74|74| 3| 4|00|03| |
La prima metà va da 268 a 317, la seconda metà da 319 a 403. 42/4 = 10.5; il primo quartile è tra il 10º e l'11º dato, ossia tra 279 e 301. 42/4*3 = 31.5; il terzo quartile è tra il 31º e il 32º dato, ossia tra 340 e 341. A seconda del software, il 1º e il 3º quartile vengono scelti tra uno di questi due dati, o un valore intermedio tra essi. Ecco i calcoli, e lo stem-and-leaf e il box-plot, fatti con questo semplice script:
e l'istogramma fatto con questo:
Col programma R ottengo i quartili scelti in un altro dei modi descritti sopra:
dati <- c(268,268,270,270,273,274,274,275,277,279,301,303,303, 304,304,310,311,311,313,314,317,319,321,322,325,327,327,327, 329,329,340,341,341,344,362,362,370,373,374,374,400,403) stem(dati) # 26 | 8800344579 # 28 | # 30 | 133440113479 # 32 | 12577799 # 34 | 0114 # 36 | 220344 # 38 | # 40 | 03 boxplot(dati,horizontal=TRUE) summary(dati) # Min. 1st Qu. Median Mean 3rd Qu. Max. # 268.0 301.5 318.0 319.7 340.8 403.0 # il programma calcola percentili e mediana in modo approssimato # Fornisce: 301.5 318.0 340.8 # invece che: 301 317 (o 319) 341 # Sta all'utente decidere se prendere i percentili tra i dati interi # o se prendere le approssimazioni (dipende dai casi). # In questo caso può aver senso prendere 301 318 341
Per altri commenti: percentili neGli Oggetti Matematici.