1) Un aggregato di persone molto numeroso è composto al 36% da uomini e al 64% da donne.
Sappiamo che per l'altezza HU (in cm) degli uomini si ha M(HU)=174.2 e σ(HU)=7.1, per quella, HD, delle
donne si ha M(HD)=168.1 e σ(HD)=6.8.
Traccia il grafico della densità di probabilità dell'altezza di questo aggregato di persone e valuta
la probabilità che, estraendo con procedimento uniforme una persona, questa sia alta più di 180.3 cm.
2) Problema analogo con bambini coetanei al posto di donne con M(HB)=132.4 e σ(HB)=5.6.
Nel primo caso, devo studiare la variabile casuale HUD che rappresenta l'altezza di una persona (dell'aggregato considerato) conoscendone la distribuzione sotto la condizione che la categoria C della persona sia "u" (la persona sia un uomo) e la distribuzione sotto la condizione che C="d" (la persona sia una donna). Nel secondo caso C può essere "u" (uomo) o "b" (bambino).
La variabile casuale HUD non è indipendente dalla variabile casuale C. Sia I un intervallo: – se C="u", HUD si comporta come HU; cioè (HUDI / C="u") equivale a HUI; – se C="d", HUD si comporta come HD; cioè (HUDI / C="d") equivale a HDI. Poiché HUDI equivale a (HUDI and C="u") or (HUDI and C="d"), ho: |
Pr(HUDI) = Pr(C="u")·Pr(HUI) + Pr(C="d")·Pr(HDI) = 36%·Pr(HUI) + 64%·Pr(HDI)
|
Volendo, posso rappresentare la situazione anche con una tabella di contingenza: se classifico le altezze in tre intervalli, dalle tabelle di sinistra relative alle due sottopopolazioni passo alla tabella a destra e determino i valori da sostituire a ? sommando le righe "u" e "d".
So che, con buona approssimazione, HU, HD e HB hanno andamento gaussiano.
Poiché, se f è la funzione di densità della variabile continua U,
Pr(UI) = a b f ,
posso dedurre che, se UD, U e D sono le funzioni densità di HUD, HU e HD:
UD(x) = 36%·U(x) + 64%·D(x)
Analogamente, nel caso dei bambini, ho: UB(x) = 36%·U(x) + 64%·B(x)
Sotto sono tracciati i grafici di UD e UB, realizzati col software online WolframAlpha (vedi). Nel caso di UB siamo di fronte a una distribuzione bimodale (ha due massimi relativi). Per la prima situazione non si ottiene una distribuzione bimodale: il grafico di UD è una curva a campana leggermente asimmetrica.
I grafici realizzati con R:
U <- function(x) dnorm(x,mean=174.2,sd=7.1) D <- function(x) dnorm(x,mean=168.1,sd=6.8) B <- function(x) dnorm(x,mean=132.4,sd=5.6) UD <- function(x) 0.36*U(x) + 0.64*D(x) UB <- function(x) 0.36*U(x) + 0.64*B(x) plot(UD,90,220) abline(v=axTicks(1),h=axTicks(2),lty=3,col="blue") abline(h=0,lty=2,col="blue") windows() plot(UB,90,220) abline(v=axTicks(1),h=axTicks(2),lty=3,col="blue") abline(h=0,lty=2,col="blue")