L'istogramma a lato rappresenta la distribuzione dei redditi un'azienda. I redditi sono espressi in migliaia di frilli all'anno (siamo in un paese in cui la moneta corrente è il frillo).
1) Ricava (come ritieni comodo) quali sono le frequenze relative (arrotondate ai decimi di percentuale, come i dati già indicati sul grafico) delle classi [20, 30), [40, 50) e [50, 60).
2) I dipendenti della azienda sono 756. Quanti sono quelli con reddito inferiore a 20 mila frilli?
3) Qual è la classe modale?
4) Quale tra i seguenti valori è il reddito mediano (in migliaia di frilli)?

12.4 20.5 27.6 30.4 32.5 36.3 45.2

1) Dall'istogramma ricavo che le frequenze percentuali richieste sono:
[20, 30): 35.0%, [40, 50): 8.1%, [50, 60): 5.4%.
Posso stimare in 0.1% la precisione di questi rilevamenti grafici. Facciamo la verifica (se il totale delle frequenze percentuali fa 100): 23.4+28.2+35.0+8.1+5.4 = 100.1. OK: 0.1% o 0.2% possono essere le differenze da 100% dovute alle approssimazioni fatte (sommo 5 dati arrotondati ai decimi). In alternativa potevo ricavare due frequenze dal grafico e trovare la terza come differenza da 100%.
2) 756·234/1000 = 176.904, che arrotondo a 177. Questa è la quantità di dipendenti con reddito che sta nella prima classe.
3) La classe modale è quella dei dipendenti con reddito tra 20 e 30 mila frilli.
4) Dall'istogramma capisco che il reddito mediano, ossia quello che divide a metà i dipendenti (378 non prendono di più di esso e 378 non prendono di meno) è inferiore, ma non di molto, a 30 mila frilli (30 mila frilli dividono il 58% che prendono meno dagli altri, 20 mila frilli dividono il 23% che prendono meno dagli altri, per cui la mediana sarà inferiore a 30 mila frilli e più vicina a questo valore che a 20 mila). Tra i valori indicati non posso che scegliere 27.6.

Per altri commenti: valori medi (2) neGli Oggetti Matematici.

Come si potrebbe fare l'istogramma con un semplice script:

Ecco l'elaborazione dei dati, opportunamente completati, mediante il programma R (la frequenza relativa visualizzata è quella unitaria; moltiplicandola per l'ampiezza dell'intervallo, ossia per 10, ritrovo il valore trovato sopra):
# Ecco i calcoli svolti con R, importando la # procedura "r.R" (vedi): source("http://macosa.dima.unige.it/r.R") freq <- c(177,265,213,61,40) interv <- c(10,20,30,40,50,60) istoclas(interv,freq) altrestat() # Min. 1st Qu. Median Mean 3rd Qu. Max. # 10.00 20.45 27.58 28.68 35.87 60.00

Ecco esempi di istogrammi realizzati con i comandi standard:

# I primi due esempi vanno bene solo per intervalli di eguale ampiezza, come questi:
freq <- c(177,265,213,61,40)
amp <- c( 10, 10, 10,10, 10)
barplot(freq/sum(freq)*100,space=0,width=amp,col="yellow", axes=FALSE)
abline(h=seq(1,40,1), lty=3,col="grey50")
abline(h=axTicks(2), lty=2)
#
freq <- c(177,265,213,61,40)
amp <-  c( 10, 10, 10,10,10)
barplot(freq/sum(freq)*100,space=0,width=amp,col="yellow",ylim=c(0,40),axes=FALSE)
abline(h=seq(1,40,1), lty=3,col="grey50")
abline(h=axTicks(2), lty=2)
axis(2,pos=0)
#
# I seguenti esempi calcolano le frequenze relative:
freq <- c(177,265,213,61,40)
amp <- c( 10, 10, 10,10, 10)
barplot(freq/sum(freq)/amp*100,space=0,width=amp,col="yellow", axes=FALSE)
abline(h=axTicks(2), lty=2)
axis(2,pos=0)
#
freq <- c(177,265,213,61,40)
amp <- c( 10, 10, 10,10, 10)
nomi <- c("[10,20)","","","","[50,60)")
barplot(freq/sum(freq)/amp*100,space=0,width=amp,col="yellow",names.arg=nomi)
abline(h=axTicks(2), lty=2)
#
# Qui, per far mettere automaticamente i valori delle tacche orizzontali giusti,
# aggiungo ad amp l'estremo sinistro del primo intervallo (10) e a freq
# la frequenza 0 che deve associare all'intervallo [0,10) (se non facessi
# così metterebbe le tacche partendo da 0 invece che da 10):
freq <- c(0,  177,265,213,61,40)
amp <- c(10,  10, 10, 10,10, 10)
barplot(freq/sum(freq)/amp*100,space=0, width=amp,xlim=c(10,60))
abline(h=axTicks(2),v=axTicks(1), lty=3)
axis(1,pos=0)