Sistemi di variabili casuali
Scheda:
Dopo una ripresa dei concetti di dipendenza ed indipendenza stocastica,
vengono introdotte le funzioni di distribuzione bivariata, le loro
rappresentazioni grafiche e i concetti di covarianza, correlazione e regressione. Tutto ciò
è illustrato attraverso vari esempi. Gli argomenti verranno ripresi
nella classe 5ª. Per affrontare la scheda (e in generale gli argomenti che essa affronta,
a meno di non ricorrere a software molto costoso) è indispensabile
l'uso di R.
[vedi anche le indicazioni presenti negli Oggetti Matematici,
qui,
relative a voci simili ai temi affrontati nella scheda]
[i commenti ad alcuni esercizi sono in corso di riscrittura, sostituendo il ricorso al programma "Stat" con quello
al programma "R"]
1.1 I concetti ripresi nel §1 sono poi richiamati in un link all'inizio del §2. Per il quesito 1 vedi l'esercizio 13 qui.
2.1 Quesito 2: Le curve di livello sono cerchi concentrici. Il volume è 1, per cui il cono deve essere alto 3/π: questo è f(0,0). Il raggio delle curve di livello varia linearmente con la quota (se questa è compresa tra 0 e 3/π).
3.1 Quesito 3: Evidentemente no, per le stesse motivazioni usate per le altre densità appena considerate.
4.1 Quesito 4:
1 -1 0.4472136 0
4.5 Quesito 5:
cor(dati$BatPrima,dati$Peso) # -0.2032213 summary(dati$BatPrima) # Min. 1st Qu. Median Mean 3rd Qu. Max. # 48.00 64.00 71.00 72.87 80.00 100.00 summary(dati$Peso) # Min. 1st Qu. Median Mean 3rd Qu. Max. # 43.00 57.00 66.00 65.84 70.25 97.00 plot(c(45,105),c(40,100),type="n") abline(h=axTicks(2),v=axTicks(1),lty=3,col="blue") points(dati$BatPrima,dati$Peso)Il fatto che il coefficiente di correlazione sia prossimo a 0 è confermato dalla disposizione grafica dei dati.
5.1 Il §5, in classi "deboli" può essere affrontato senza approfondire gli aspetti tecnici di analisi, usando il programma (usato anche per svolgere gli esercizi finali della sezione 19 - vedi) a cui si è rinviati prima del quesito 8.
5.2 Quesito 6: vedi.
5.3 Quesito 7 e 8:
x <- c(2, 4, 7); y <- c(14, 23, 26) plot(c(0,8),c(0,35),type="n",xlab="",ylab="") abline(v=axTicks(1), h=axTicks(2), col="blue",lty=3) points(x,y,pch=19) mod = lm(y ~ x); mod$coefficients #(Intercept) x # 11.078947 2.289474 abline(mod, col="brown",lwd=2) k <- mean(x*y)/mean(x^2); k # 4.376812 abline(0,k, col="blue",lwd=2) points(mean(x),mean(y),lwd=4,col="red")4.376812 e 2.289474 sono i due valori richiesti.
e1
# I dati, colonna per colonna, e le dimensioni della tabella T0 <- c(603,5051,7787, 246,1311,7901) nomi <- list(c("primario","secondario","altro"),c("M","F")) T <- array(T0,dim=c(3,2),dimnames=nomi); T # M F # primario 603 246 # secondario 5051 1311 # altro 7787 7901 # La distribuzione percentuale prop.table(T)*100 # M F # primario 2.633303 1.074283 # secondario 22.057732 5.725141 # altro 34.005852 34.503690 # I profili colonna prop.table(T[,1])*100 # primario secondario altro # 4.486273 37.579049 57.934677 prop.table(T[,2])*100 # primario secondario altro # 2.600973 13.861281 83.537746 # I profili riga # La ripartizione percentuale per sesso degli occupati # in primario, secondario, altro prop.table(T[1,])*100 # M F # 71.02473 28.97527 prop.table(T[2,])*100 # M F # 79.39327 20.60673 prop.table(T[3,])*100 # M F # 49.63666 50.36334
e2
rowSums(T)/sum(T)*100 # primario secondario altro # 3.707585 27.782873 68.509542 colSums(T)/sum(T)*100 # M F # 58.69689 41.30311
e3 Vedi l'esercizio 6 qui.
e4 Vedi l'esercizio 7 qui.
e5
x <- c(50, 100, 200, 250, 350) y <- c(7.5, 15, 12.5, 10, 17.5) plot(x,y,pch=19,xlim=c(0,400),ylim=c(5,20)) abline(h=seq(5,20,1),v=seq(0,400,50),lty=3,col="blue") cor(x,y) # 0.5960396
e6
dati <- read.table("http://macosa.dima.unige.it/R/battito.txt",sep=",",header=TRUE) summary(dati$BatPrima) # Min. 1st Qu. Median Mean 3rd Qu. Max. # 48.00 64.00 71.00 72.87 80.00 100.00 summary(dati$Sesso) # Min. 1st Qu. Median Mean 3rd Qu. Max. # 1.00 1.00 1.00 1.38 2.00 2.00 plot(c(45,105),c(0.5,2.5),type="n") abline(h=axTicks(2),v=axTicks(1),lty=3,col="blue") points(dati$BatPrima,dati$Sesso) points(mean(dati$BatPrima),mean(dati$Sesso),pch=19,col="red") cor(dati$BatPrima,dati$Sesso) # 0.2853926
e7
# aggiungo alle istruzioni di e5 mod = lm(y ~ x); mod$coefficients (Intercept) x 8.75000000 0.01973684 abline(mod, col="brown",lwd=2) mod2 = lm(x ~ y); mod2$coefficients (Intercept) y -35 18 # x = a y + b -> ay = x-b -> y = (x-b)/a g <- function(x) (x+35)/18 curve(g,add=TRUE,col="red",lwd=2) points(mean(x),mean(y),lwd=4,col="blue")
e8
x <- c(1,2,3,4,5,6,7) y1 <- c(4,5,4,5,4,5,4); cor(x,y1) # 0 y2 <- c(1,3,2,5,4,5,7); cor(x,y2) # 0.9097177 y3 <- c(7,4,2,1,2,4,7); cor(x,y3) # 0
e9 Vedi l'esercizio 7 qui.