Sistemi di variabili casuali

Indice guide

Scheda (versione B):  Dopo una ripresa dei concetti di dipendenza ed indipendenza stocastica, vengono introdotte le funzioni di distribuzione bivariata, le loro rappresentazioni grafiche e i concetti di covarianza, correlazione e regressione. Tutto ciò è illustrato attraverso vari esempi. Gli argomenti verranno ripresi nella classe 5ª.  Per affrontare la scheda (e in generale gli argomenti che essa affronta, a meno di non ricorrere a software molto costoso) è indispensabile l'uso di R.  [vedi anche le indicazioni presenti negli Oggetti Matematici, qui, relative a voci simili ai temi affrontati nella scheda]
[i commenti ad alcuni esercizi sono in corso di riscrittura, sostituendo il ricorso al programma "Stat" con quello al programma "R"]

1.1   I concetti ripresi nel §1 sono poi richiamati in un link all'inizio del §2. Per il quesito 1 vedi l'esercizio 13 qui.

2.1   Quesito 2:   Le curve di livello sono cerchi concentrici. Il volume è 1, per cui il cono deve essere alto 3/π: questo è f(0,0). Il raggio delle curve di livello varia linearmente con la quota (se questa è compresa tra 0 e 3/π).

3.1   Quesito 3:   Evidentemente no, per le stesse motivazioni usate per le altre densità appena considerate.

4.1   Quesito 4:

  1       -1       0.4472136       0

4.5   Quesito 5:

cor(dat$BatPrima,dat$Peso)
# -0.2032213
summary(dat$BatPrima)
#   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#  48.00   64.00   71.00   72.87   80.00  100.00 
summary(dat$Peso)
#   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#  43.00   57.00   66.00   65.84   70.25   97.00 
Plane(45,105, 40,100); abovex("BatPrima"); abovey("Peso")
Point(dat$BatPrima,dat$Peso,"brown")
Il fatto che il coefficiente di correlazione sia prossimo a 0 è confermato dalla disposizione grafica dei dati.

5.1   Il §5, in classi "deboli" può essere affrontato senza approfondire gli aspetti tecnici di analisi, usando il programma (usato anche per svolgere gli esercizi finali della sezione 19 - vedi) a cui si è rinviati prima del quesito 8.

5.2   Quesito 6:   vedi.

5.3   Quesito 7 e 8:

x = c(2, 4, 7); y = c(14, 23, 26)
Plane(0,8, 0,30); POINT(x,y, "black")
regression(x,y,0,0)
# 4.377 * x
regression1(x,y)
# 2.289 * x + 11.08
f=function(x) 2.289 * x + 11.08; graph1(f,0,8, "brown")
g=function(x) 4.377 * x; graph1(g,0,8, "blue")
# il baricentro
POINT(mean(x),mean(y), "red")
4.377 e 2.289 sono i due valori richiesti.
Il baricentro passa per la rette di regressione non vincolata a passare per un punto fissato.

e1

da = c(603,5051,7787, 246,1311,7901)
name = list(c("primary","secondary","tertiary"), c("males","females"))
T1 = array(round(da/sum(da)*100,2), dim=c(3,2) , dimnames=name); T1
#           males females
# primary    2.63    1.07
# secondary 22.06    5.73
# tertiary  34.01   34.50
round(prop.table(T1[1,])*100,1)
#   males females 
#    71.1    28.9 
round(prop.table(T1[2,])*100,1)
#   males females 
#    79.4    20.6 
round(prop.table(T1[3,])*100,1)
#   males females 
#    49.6    50.4 

e2

rowSums(T)/sum(T)*100
#  primary secondary  tertiary 
# 3.707585 27.782873 68.509542 
round(rowSums(T)/sum(T)*100,1)
#  primary secondary  tertiary 
#      3.7      27.8      68.5 
#
colSums(T)/sum(T)*100
#    males  females 
# 58.69689 41.30311 
round(colSums(T)/sum(T)*100,1)
#  males females 
#   58.7    41.3

e3  Vedi l'esercizio 6 qui.

e4  Vedi l'esercizio 7 qui.

e5

x <- c(50, 100, 200, 250, 350)
y <- c(7.5, 15, 12.5, 10, 17.5)
Plane(0,400, 5,20); POINT(x,y, "brown")
cor(x,y)
# 0.5960396

e6

dat=read.table("http://macosa.dima.unige.it/R/battito.txt",sep=",",header=TRUE)
summary(dat$BatPrima)
#   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#  48.00   64.00   71.00   72.87   80.00  100.00 
summary(dat$Sesso)
#   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#   1.00    1.00    1.00    1.38    2.00    2.00 
BF=5; HF=2; Plane(45,105, 0.7,2.2)
POINT(dat$BatPrima,dat$Sesso, "brown")
POINT(mean(dat$BatPrima),mean(dat$Sesso), "blue")

cor(dat$BatPrima,dat$Sesso)
# 0.2853926

e7

# aggiungo alle istruzioni di e5
regression1(x,y)
# 0.01974 * x + 8.75 
f=function(x) 0.01974 * x + 8.75; graph1(f,0,400, "brown")
regression1(y,x)
# 18 * x + -35 
g=function(x,y) 18*y-35-x
CUR(g, "red")
POINT(mean(x),mean(y), "blue")

e8

x <- c(1,2,3,4,5,6,7)
y1 <- c(4,5,4,5,4,5,4); cor(x,y1)
#  0
y2 <- c(1,3,2,5,4,5,7); cor(x,y2)
#  0.9097177
y3 <- c(7,4,2,1,2,4,7); cor(x,y3)
#  0

e9   Vedi l'esercizio 7 qui.