In un ospedale vengono rilevati i seguenti dati, relativi alla frequenza cardiaca a riposo di 10 individui e i loro anni complessivi di istruzione. Rappresenta graficamente i dati nel piano (durata istruzione, frequenza) e calcola il corrispondente coefficiente di correlazione lineare. Discuti gli esiti.
 
 soggetto   1    2   3   4   5    6   7   8   9   10 
Anni di istruzione121613181912 18191214
 Battiti al minuto 73677463 738460627671

Analizzando i dati, a mano, con una calcolatrice, ... o con questo script ottengo:

Posso rappresentare la situazione anche graficamente, ad esempio con questo script:

Il coefficiente di correlazzione -0.7638 e il grafico indicano una forte associazione tra una lunga scolarizzazione e una bassa frequenza cardiaca a riposo, ma questo non indica una relazione di causa-effetto: evidentemente aumentare gli anni di studio non diminuisce il numero dei battiti. In questo caso, come in gran parte dei casi, la presenza di un coefficiente di correlazione in valore assoluto vicino ad 1 non indica la presenza di un rapporto di casua-effetto, ma il legame di entrambe le variabili ad uno o più fattori impliciti. Nel caso in questione questi potrebbero essere l'informazione sui regimi alimentari che tendenzialmente cresce all'aumentare dell'istruzione, il tempo o la voglia di svolgere adeguata attività fisica che tendenzialmente cresce quando si svolge un lavoro che lascia più tempo ed energie per essa, il fatto che un miglior reddito consente di acquistare alimenti migliori, ...

  Per altri commenti: Correlazione tra variabili casuali neGli Oggetti Matematici.


Analisi dei dati con il programma R:

  
source("http://macosa.dima.unige.it/r.R")
anni  <-   c(12,16,13,18,19,12,18,19,12,14)
battiti <- c(73,67,74,63,73,84,60,62,76,71)
cor(anni, battiti)
#  -0.7638033
Plane(10,20, 55,90)
POINT(anni,battiti, "brown")
regression1(anni,battiti)
# -1.862 * x + 98.79
f = function(x) -1.862 * x + 98.79
graph1(f, 10,20, "black")