Per la produzione di una certa fibra sintetica viene usato del materiale collocato in un magazzino che non dispone di controllo della umidità. Per 15 giorni vengono misurate l'umidità atmosferica e l'acqua assorbita dal materiale. Nel file allegato (caricabile in fomato testo) sono riportati gli esiti di queste misurazioni, riportati opportunamente in forma percentuale.  Stima, usando adeguato software, la retta di regressione.

Prima affrontiamo il problema con degli script online, poi vedermo come affrontarlo con R.

Con lo script linear regression trovo:

Il legame tra umidità ed acqua assorbita è dunque rappresentabile con l'equazione y = -2.51 + 0.323·x.
Posso rappresentare graficamente i dati e la retta di regressione con questo script, che conferma visivamente la bontà della scelta di una relazione lineare tra le due grandezze:

 
Con R ottengo:

readLines("http://macosa.dima.unige.it/om/esr/pro/fibra.txt",n=3)
# "'umidità ambiente, acqua assorbita"                                    
#  "36;10"  "39;11"
# Il separatore è ";"; c'è una riga da saltare; ...
dati= read.table("http://macosa.dima.unige.it/om/esr/pro/fibra.txt",header=FALSE,skip=1,sep =";")
str(dati)  # esamino velocemente i dati
# 'data.frame':   15 obs. of  2 variables:
#  $ V1: int  36 39 47 49 52 38 55 32 57 54 ...
#  $ V2: int  10 11 11 12 14 9 16 8 18 14 ...
x=dati$V1; y=dati$V2; range(x); range(y)
#    29  61     7 18
BF=3; HF=2.5; Plane(0,70, 0,20); POINT(x,y,"brown")
regression1(x,y)
# 0.3232 * x + -2.51 
f = function(x) 0.3232 * x + -2.51; graph1(f,0,70, "blue")
# Volendo un intervallo di confidenza per i coefficienti di regressione:
confInt(y,x, 90/100)                # prima y poi x (y in funz. di x)
#                   5 %       95 %
# (Intercept) -4.8399849 -0.1809304
# Conf         0.2736966  0.3727105
        Per altri commenti: Correlazione tra variabili casuali neGli Oggetti Matematici.