BiVar-Guida

Sistemi di variabili casuali

Scheda: Dopo una ripresa dei concetti di dipendenza ed indipendenza stocastica, vengono introdotte le funzioni di distribuzione bivariata, le loro rappresentazioni grafiche e i concetti di covarianza, correlazione e regressione. Tutto ciò è illustrato attraverso vari esempi. Gli argomenti verranno ripresi nella classe 5ª. Per affrontare la scheda (e in generale gli argomenti che essa affronta, a meno di non ricorrere a software molto costoso) è indispensabile l'uso di R. [vedi anche le indicazioni presenti negli Oggetti Matematici, qui, relative a voci simili ai temi affrontati nella scheda]
[i commenti ad alcuni esercizi sono in corso di riscrittura, sostituendo il ricorso al programma "Stat" con quello al programma "R"]

1.1 I concetti ripresi nel §1 sono poi richiamati in un link all'inizio del §2. Per il quesito 1 vedi l'esercizio 13 qui.

2.1 Quesito 2: Le curve di livello sono cerchi concentrici. Il volume è 1, per cui il cono deve essere alto 3/π: questo è f(0,0). Il raggio delle curve di livello varia linearmente con la quota (se questa è compresa tra 0 e 3/π).

3.1 Quesito 3: Evidentemente no, per le stesse motivazioni usate per le altre densità appena considerate.

4.1 Quesito 4:

1 -1 0.4472136 0

4.5 Quesito 5:

cor(dati$BatPrima,dati$Peso)
# -0.2032213
summary(dati$BatPrima)
#   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#  48.00   64.00   71.00   72.87   80.00  100.00 
summary(dati$Peso)
#   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#  43.00   57.00   66.00   65.84   70.25   97.00 
plot(c(45,105),c(40,100),type="n")
abline(h=axTicks(2),v=axTicks(1),lty=3,col="blue")
points(dati$BatPrima,dati$Peso)

Il fatto che il coefficiente di correlazione sia prossimo a 0 è confermato dalla disposizione grafica dei dati.

5.1 Il §5, in classi "deboli" può essere affrontato senza approfondire gli aspetti tecnici di analisi, usando il programma (usato anche per svolgere gli esercizi finali della sezione 19 - vedi) a cui si è rinviati prima del quesito 8.

5.2 Quesito 6: vedi.

5.3 Quesito 7 e 8:

x <- c(2, 4, 7); y <- c(14, 23, 26)
plot(c(0,8),c(0,35),type="n",xlab="",ylab="")
abline(v=axTicks(1), h=axTicks(2), col="blue",lty=3)
points(x,y,pch=19)
mod = lm(y ~ x); mod$coefficients
#(Intercept)           x 
#  11.078947    2.289474 
abline(mod, col="brown",lwd=2)
k <- mean(x*y)/mean(x^2); k
# 4.376812
abline(0,k, col="blue",lwd=2)
points(mean(x),mean(y),lwd=4,col="red")

4.376812 e 2.289474 sono i due valori richiesti.

#  I dati, colonna per colonna, e le dimensioni della tabella
T0 <- c(603,5051,7787, 246,1311,7901) 
nomi <- list(c("primario","secondario","altro"),c("M","F"))
T <- array(T0,dim=c(3,2),dimnames=nomi); T
#               M    F
# primario    603  246
# secondario 5051 1311
# altro      7787 7901
#    La distribuzione percentuale
prop.table(T)*100
#                    M         F
# primario    2.633303  1.074283
# secondario 22.057732  5.725141
# altro      34.005852 34.503690
#     I profili colonna
prop.table(T[,1])*100
#   primario secondario      altro 
#   4.486273  37.579049  57.934677 
prop.table(T[,2])*100
#   primario secondario      altro 
#   2.600973  13.861281  83.537746 
#     I profili riga
# La ripartizione percentuale per sesso degli occupati
# in  primario,  secondario,  altro
prop.table(T[1,])*100
#        M        F 
# 71.02473 28.97527 
prop.table(T[2,])*100
#        M        F 
# 79.39327 20.60673 
prop.table(T[3,])*100
#        M        F 
# 49.63666 50.36334

rowSums(T)/sum(T)*100
#   primario secondario      altro 
#   3.707585  27.782873  68.509542 
colSums(T)/sum(T)*100
#        M        F 
# 58.69689 41.30311

e3 Vedi l'esercizio 6 qui.

e4 Vedi l'esercizio 7 qui.

x <- c(50, 100, 200, 250, 350)
y <- c(7.5, 15, 12.5, 10, 17.5)
plot(x,y,pch=19,xlim=c(0,400),ylim=c(5,20))
abline(h=seq(5,20,1),v=seq(0,400,50),lty=3,col="blue")
cor(x,y)
# 0.5960396

dati <- read.table("http://macosa.dima.unige.it/R/battito.txt",sep=",",header=TRUE)
summary(dati$BatPrima)
#   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#  48.00   64.00   71.00   72.87   80.00  100.00 
summary(dati$Sesso)
#   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#   1.00    1.00    1.00    1.38    2.00    2.00 
plot(c(45,105),c(0.5,2.5),type="n")
abline(h=axTicks(2),v=axTicks(1),lty=3,col="blue")
points(dati$BatPrima,dati$Sesso)
points(mean(dati$BatPrima),mean(dati$Sesso),pch=19,col="red")

cor(dati$BatPrima,dati$Sesso)
# 0.2853926

# aggiungo alle istruzioni di e5
 mod = lm(y ~ x); mod$coefficients
(Intercept)           x 
 8.75000000  0.01973684 
abline(mod, col="brown",lwd=2)
mod2 = lm(x ~ y); mod2$coefficients
(Intercept)           y 
        -35          18 
#  x = a y + b  ->  ay = x-b  ->  y = (x-b)/a
g <- function(x) (x+35)/18
curve(g,add=TRUE,col="red",lwd=2)
points(mean(x),mean(y),lwd=4,col="blue")

x <- c(1,2,3,4,5,6,7)
y1 <- c(4,5,4,5,4,5,4); cor(x,y1)
#  0
y2 <- c(1,3,2,5,4,5,7); cor(x,y2)
#  0.9097177
y3 <- c(7,4,2,1,2,4,7); cor(x,y3)
#  0

e9 Vedi l'esercizio 7 qui.