In un manuale di "statistica della misura" si trovano i seguenti tre esempi di grafici di funzioni di densità di una variabile casuale continua x. Il caso B si riferisce a situazioni che si incontrano raramente, gli altri due casi a situazioni più usuali. Prova a descrivere le principali differenze tra le tre distribuzioni.

La distribuzione A ha moda che, grosso modo, corrisponde alla media e alla mediana. La moda è l'unico massimo ben pronunciato; c'è un secondo massimo relativo, ma di entità molto inferiore. L'andamento è grosso modo simmetrico rispetto alla media.
Anche la distribuzione C ha un massimo (moda) ben pronunciato, ma è collocato all'estremo sinistro; la funzione di densità è monotona. La media è leggermente superiore alla mediana: ciò è dovuto alla decrescenza, a forma di triangolo, del grafico di f.
La curva B ha più massimi relativi ben pronunciati, separati da intervalli in cui la funzione di densità quasi si annulla.

Il manuale è  "Metodologia statistica della misura" di Goggi, Lodi Rizzini, Manuzio.

Per altri commenti: Leggi di distribuzione (continue) neGli Oggetti Matematici.


Per inciso, vediamo come potremmo verificare che, nel caso C, la media è superiore alla mediana, e stimare la differenza, in base al grafico.  Copiamo il grafico e lo mettiamo su una applicazione per disegno (basta Paint). Leggiamo le coordinate dei punti che formano il grafico, ad esempio ogni 10 pixel in orizzontale. Con un particolare computer, con un particolare piazzamento della figura, …, otteniamo:
460,470,480,490,500,510,520,530,540,550,560,570,580,590,600,610,620,630,640,650,660,670
154,155,155,156,158,160,164,168,172,178,183,190,196,204,210,215,219,222,225,230,234,238.
Le ordinate dei pixel sono indicate dall'alto in basso. L'asse delle ascisse è all'altezza 238. L'origine è 460, 238.
Facciamo calcoli e rappresentazioni con R (vedi), ma potrebbe essere usata un'altra applicazione.

source("http://macosa.dima.unige.it/r.R")
y1 = c(155,155,155,156,158,160,164,168,172,178,183,190,196,204,210,215,219,222,225,230,234,238)
x1 = c(460,470,480,490,500,510,520,530,540,550,560,570,580,590,600,610,620,630,640,650,660,670)
# È comodo far partire le x da 0:
x = x1-460; x
#   0  10  20  30  40  50  60  70  80  90 100 110 120 130 140 150 160 170 180 190 200 210
# Inverto le y e le faccio partire da 0, che corrisponde al pixel alla quota 238:
y = -y1+238; y
#  83 83 83 82 80 78 74 70 66 60 55 48 42 34 28 23 19 16 13  8  4  0
BF=6; HF=3; PLANE(0,max(x), 0,max(y))
Point(x,y,"blue"); polyl(x,y,"blue")
# OK: il grafico ha la stessa forma

## Calcolo l'area di un poligono noti i vertici e, usando questa, l'approssimazione
## dell'integrale di una funzione noti un po' di x e le corrispondenti y
## L'area sottesa al grafico nel nostro caso (vedi):
INTEGRAL = function(x,y) areaPol( c(x[length(x)],x[1],x), c(0,0,y) ); INTEGRAL(x,y)
# 10075    Torna: è circa un triangolo di base 200 e altezza 100
#
## Per calcolare la media prendo come nuove y le frequenze relative: le vecchie y diviso l'integrale
y2 = y/INTEGRAL(x,y)
## La media  l'integrale del prodotto di x per le frequenze relative
media <- INTEGRAL(x,x*y2); media
#  69.57816
## Traccio in blu la retta verticale passante per il valor medio
abline(v=media,col="brown")
#
## Trovo la mediana, per tentativi ragionati:
n = 7; integr(x[1:n],y2[1:n])
#  0.4808933
n = 8; integr(x[1:n],y3[1:n])
#  0.5523573
## Sta tra n=7 (x[7]=60) e n=8 (x[8]=70), e posso stimare sia circa 63.
## Miglioro la valutazione approssimando la curva col segmento tra 7^ e 8^ punto
n = 7
k = 3; xx = x[n]+k; yy = y2[n]+(y2[n+1]-y2[n])/(x[n+1]-x[n])*k; integr(c(x[1:n],xx),c(y2[1:n],yy))
#  0.5027494
k = 2.7; xx = x[n]+k; yy = y2[n]+(y2[n+1]-y2[n])/(x[n+1]-x[n])*k; integr(c(x[1:n],xx),c(y2[1:n],yy))
#  0.5005799
k = 2.6; xx = x[n]+k; yy = y2[n]+(y2[n+1]-y2[n])/(x[n+1]-x[n])*k; integr(c(x[1:n],xx),c(y2[1:n],yy))
#  0.4998559
## Concludo che la mediana è:
mediana = x[n]+2.6; mediana
#  62.6
abline(v=mediana,col="red",lwd=3)