1)Un aggregato di persone molto numeroso è composto al 36% da uomini e al 64% da donne.
Sappiamo che per l'altezza HU (in cm) degli uomini si ha M(HU)=174.2 e σ(HU)=7.1, per quella, HD, delle donne si ha M(HD)=168.1 e σ(HD)=6.8.
Traccia il grafico della densità di probabilità dell'altezza di questo aggregato di persone e valuta la probabilità che, estraendo con procedimento uniforme una persona, questa sia alta più di 180.3 cm.
2)Problema analogo con bambini coetanei al posto di donne con M(HB)=132.4 e σ(HB)=5.6.

Nel primo caso, devo studiare la variabile casuale HUD che rappresenta l'altezza di una persona (dell'aggregato considerato) conoscendone la distribuzione sotto la condizione che la categoria C della persona sia "u" (la persona sia un uomo) e la distribuzione sotto la condizione che C="d" (la persona sia una donna). Nel secondo caso C può essere "u" (uomo) o "b" (bambino).

La variabile casuale HUD non è indipendente dalla variabile casuale C. Sia I un intervallo:

–  se C="u", HUD si comporta come HU; cioè (HUDI / C="u") equivale a HUI;

–  se C="d", HUD si comporta come HD; cioè (HUDI / C="d") equivale a HDI.
Poiché HUDI equivale a (HUDI and C="u") or (HUDI and C="d"), ho:

Pr(HUDI) = Pr(C="u")·Pr(HUI) + Pr(C="d")·Pr(HDI) = 36%·Pr(HUI) + 64%·Pr(HDI)

I1 I2 I3 tot

u p₁ p₂ p₃ 100%

d q₁ q₂ q₃ 100%

Volendo, posso rappresentare la situazione anche con una tabella di contingenza: se classifico le altezze in tre intervalli, dalle tabelle di sinistra relative alle due sottopopolazioni passo alla tabella a destra e determino i valori da sostituire a ? sommando le righe "u" e "d".

So che, con buona approssimazione, HU, HD e HB hanno andamento gaussiano.
Poiché, se f è la funzione di densità della variabile continua U, Pr(UI) = _a ^b f , posso dedurre che, se UD, U e D sono le funzioni densità di HUD, HU e HD:

UD(x) = 36%·U(x) + 64%·D(x)

Analogamente, nel caso dei bambini, ho: UB(x) = 36%·U(x) + 64%·B(x)

Sotto sono tracciati i grafici di UD e UB, realizzati col software online WolframAlpha (vedi). Nel caso di UB siamo di fronte a una distribuzione bimodale (ha due massimi relativi). Per la prima situazione non si ottiene una distribuzione bimodale: il grafico di UD è una curva a campana leggermente asimmetrica.

plot y=exp(-((x-174.2)/7.1)^2/2)/(sqrt(2*PI)*7.1)*0.36+exp(-((x-168.1)/6.8)^2/2)/(sqrt(2*PI)*6.8)*0.64, 100<x<200
plot y=exp(-((x-174.2)/7.1)^2/2)/(sqrt(2*PI)*7.1)*0.36+exp(-((x-132.4)/5.6)^2/2)/(sqrt(2*PI)*5.6)*0.64, 100<x<200

I grafici realizzati con R:

U <- function(x) dnorm(x,mean=174.2,sd=7.1)
D <- function(x) dnorm(x,mean=168.1,sd=6.8)
B <- function(x) dnorm(x,mean=132.4,sd=5.6)
UD <- function(x) 0.36*U(x) + 0.64*D(x)
UB <- function(x) 0.36*U(x) + 0.64*B(x)
plot(UD,90,220)
abline(v=axTicks(1),h=axTicks(2),lty=3,col="blue")
abline(h=0,lty=2,col="blue")
windows()
plot(UB,90,220)
abline(v=axTicks(1),h=axTicks(2),lty=3,col="blue")
abline(h=0,lty=2,col="blue")