In un gruppo di 5 adulti la somministrazione di dosi diverse di un farmaco ha comportato le seguenti diminuzioni di pressione arteriosa ("mg" dose in mg, "mm" diminuzione della pressione in mm di Hg):

mg = c( 7, 12, 15, 20, 22)
mm = c(10, 18, 20, 25, 25)

Usando una retta di regressione si ottieme che 11 mg è la dose ottimale per ottenere una diminuzione della pressione pari a 15 mm Hg.  Valuta questa conclusione.

  

È una conclusione priva di fondamenti, per svariati motivi.  Al di là degli aspetti matematici, su cui torneremo, assumere la retta di regressione per stimare la relazione tra le due grandezze, e con così pochi dati, può suscitare qualche altra perplessità:  come si vede dal grafico, ad una dose nulla del farmaco (intercetta con l'asse verticale) sembra corrispondere una diminuzione non nulla della pressione!  Può anche darsi che per questo farmaco si abbia un fenomeno di saturazione, come sembra suggerire anche l'andamento curvilineo verso cui sembrano disporsi i punti.
Affrontiamo la questione esaminando anche il punto di vista matematico.  Nel grafico seguente sono tracciate, oltre alla retta di regressione senza vincoli (blu), quella (verde) vincolata a passare per (0,0) e (rossa) la parabola di regressione.  Col secondo grafico la dose ottimale sarebbe di 8 mg, col terzo di 10 mg!

L'esempio (che dovrebbe servire, un po', come antidoto contro gli strani usi della statistica fatti spesso in ambito biologico e medico) è tratto da Matematica per discipline bio-mediche di Vinicio Villani.

Sotto gli script online con cui sono stati fatti i calcoli; vedi qui.  Il grafico è stato realizzato con questo script.




Calcoli e grafici con R (vedi).

mg = c( 7, 12, 15, 20, 22)
mm = c(10, 18, 20, 25, 25)
BF=3; HF=3
Plane(0,25, 0,30); abovex("mg"); abovey("mm")
POINT(mg,mm, "brown")
regression1(mg,mm)
# 0.9973 * x + 4.441 
f = function(x) 0.9973 * x + 4.441; graph2(f, 0,25, "seagreen")
solution(f,15, 0,25)
# 10.58759
pointO(10.59, 15, "black")

La retta di regressione ottenuta è frutto di solo 5 prove. Quanto è affidabile? Valtutiamolo:

confInt(mm,mg, 90/100)          # metto prima mm e poi mg
#                    5 %     95 %
# (Intercept) -0.4139182 9.296752
# Conf         0.6963915 1.298159
# L'intercetta sull'asse y varia da 0 a 10. La pendenza da 0.7 a 1.3
# Anche con un inetervallo di confidenza più ampio otterrei valori molto vari
confInt(mm,mg, 75/100)
#                12.5 %   87.5 %
# (Intercept) 1.5063316 7.376502
# Conf        0.8153888 1.179162