In un ospedale vengono rilevati i seguenti dati, relativi alla frequenza cardiaca a riposo
di 10 individui e i loro anni complessivi di istruzione. Rappresenta graficamente i dati
nel piano |
|||||||||||||||||||||||||||||||||
|
Analizzando i dati, a mano, con una calcolatrice, ... o con questo script ottengo:
Posso rappresentare la situazione anche graficamente, ad esempio con questo script:
Il coefficiente di correlazzione -0.7638 e il grafico indicano una forte associazione tra una lunga scolarizzazione e una bassa frequenza cardiaca a riposo, ma questo non indica una relazione di causa-effetto: evidentemente aumentare gli anni di studio non diminuisce il numero dei battiti. In questo caso, come in gran parte dei casi, la presenza di un coefficiente di correlazione in valore assoluto vicino ad 1 non indica la presenza di un rapporto di casua-effetto, ma il legame di entrambe le variabili ad uno o più fattori impliciti. Nel caso in questione questi potrebbero essere l'informazione sui regimi alimentari che tendenzialmente cresce all'aumentare dell'istruzione, il tempo o la voglia di svolgere adeguata attività fisica che tendenzialmente cresce quando si svolge un lavoro che lascia più tempo ed energie per essa, il fatto che un miglior reddito consente di acquistare alimenti migliori, ...
Per altri commenti: Correlazione tra variabili casuali neGli Oggetti Matematici.
Analisi dei dati con il programma R:
source("http://macosa.dima.unige.it/r.R") anni <- c(12,16,13,18,19,12,18,19,12,14) battiti <- c(73,67,74,63,73,84,60,62,76,71) cor(anni, battiti) # -0.7638033 Plane(10,20, 55,90) POINT(anni,battiti, "brown") regression1(anni,battiti) # -1.862 * x + 98.79 f = function(x) -1.862 * x + 98.79 graph1(f, 10,20, "black") |