L'istogramma a lato rappresenta la distribuzione dei redditi
un'azienda. I redditi sono espressi in migliaia di frilli all'anno
(siamo in un paese in cui la moneta corrente è il frillo). 12.4 20.5 27.6 30.4 32.5 36.3 45.2 |
1) Dall'istogramma ricavo che le frequenze percentuali richieste sono:
[20, 30): 35.0%,
[40, 50): 8.1%,
[50, 60): 5.4%.
Posso stimare in 0.1% la precisione di questi rilevamenti grafici.
Facciamo la verifica (se il totale delle frequenze percentuali fa 100):
23.4+28.2+35.0+8.1+5.4 = 100.1. OK: 0.1% o 0.2% possono essere le differenze da 100%
dovute alle approssimazioni fatte (sommo 5 dati arrotondati ai decimi).
In alternativa potevo ricavare due frequenze dal grafico e trovare la terza come differenza da
100%.
2) 756·234/1000 = 176.904, che arrotondo a 177. Questa è la quantità
di dipendenti con reddito che sta nella prima classe.
3) La classe modale è quella dei dipendenti con reddito tra 20 e 30 mila
frilli.
4) Dall'istogramma capisco che il reddito mediano, ossia quello che divide a metà
i dipendenti (378 non prendono di più di esso e 378 non prendono di meno) è
inferiore, ma non di molto, a 30 mila frilli (30 mila frilli dividono il 58% che prendono meno dagli altri,
20 mila frilli dividono il 23% che prendono meno dagli altri, per cui la
mediana sarà inferiore a 30 mila frilli e più vicina a questo
valore che a 20 mila). Tra i valori indicati non posso che scegliere 27.6.
Per altri commenti: valori medi (2) neGli Oggetti Matematici.
Come si potrebbe fare l'istogramma con un semplice script:
Ecco l'elaborazione dei dati, opportunamente completati, mediante il programma R (la frequenza relativa visualizzata è quella unitaria; moltiplicandola per l'ampiezza dell'intervallo, ossia per 10, ritrovo il valore trovato sopra):
# Ecco i calcoli svolti con R, importando la # procedura "r.R" (vedi): source("http://macosa.dima.unige.it/r.R") freq <- c(177,265,213,61,40) interv <- c(10,20,30,40,50,60) istoclas(interv,freq) altrestat() # Min. 1st Qu. Median Mean 3rd Qu. Max. # 10.00 20.45 27.58 28.68 35.87 60.00 |
Ecco esempi di istogrammi realizzati con i comandi standard:
# I primi due esempi vanno bene solo per intervalli di eguale ampiezza, come questi: freq <- c(177,265,213,61,40) amp <- c( 10, 10, 10,10, 10) barplot(freq/sum(freq)*100,space=0,width=amp,col="yellow", axes=FALSE) abline(h=seq(1,40,1), lty=3,col="grey50") abline(h=axTicks(2), lty=2) # freq <- c(177,265,213,61,40) amp <- c( 10, 10, 10,10,10) barplot(freq/sum(freq)*100,space=0,width=amp,col="yellow",ylim=c(0,40),axes=FALSE) abline(h=seq(1,40,1), lty=3,col="grey50") abline(h=axTicks(2), lty=2) axis(2,pos=0) # # I seguenti esempi calcolano le frequenze relative: freq <- c(177,265,213,61,40) amp <- c( 10, 10, 10,10, 10) barplot(freq/sum(freq)/amp*100,space=0,width=amp,col="yellow", axes=FALSE) abline(h=axTicks(2), lty=2) axis(2,pos=0) # freq <- c(177,265,213,61,40) amp <- c( 10, 10, 10,10, 10) nomi <- c("[10,20)","","","","[50,60)") barplot(freq/sum(freq)/amp*100,space=0,width=amp,col="yellow",names.arg=nomi) abline(h=axTicks(2), lty=2) # # Qui, per far mettere automaticamente i valori delle tacche orizzontali giusti, # aggiungo ad amp l'estremo sinistro del primo intervallo (10) e a freq # la frequenza 0 che deve associare all'intervallo [0,10) (se non facessi # così metterebbe le tacche partendo da 0 invece che da 10): freq <- c(0, 177,265,213,61,40) amp <- c(10, 10, 10, 10,10, 10) barplot(freq/sum(freq)/amp*100,space=0, width=amp,xlim=c(10,60)) abline(h=axTicks(2),v=axTicks(1), lty=3) axis(1,pos=0)