I comandi di R impiegabili per una gestione in laboratorio di alcuni dei contenuti della scheda.
Le schede successive a "Le statistiche 3" in genere contengono informazioni per la gestione in laboratorio informatico dei contenuti.
Vedi qui per una guida all'uso di R (clicca "Command index" per un indice alfabetico)
Le statistiche
Alcuni modelli per la rappresentazione dei dati
Scheda 2
I record
0. Introduzione
1. Il salto in alto - I grafici
2. Record maschili e femminili - I numeri indici e le variazioni percentuali
3. Ancora sui grafici - Le funzioni - Loro rappresentazione con software
4. Le tecniche e le attrezzature (approfondimenti)
5. Esercizi
0. Introduzione
Nella scheda 1 abbiamo considerato alcuni modelli matematici
usati nelle statistiche.
Abbiamo visto come con rappresentazioni grafiche e numeriche si possa
facilitare il confronto tra dati diversi, tra le parti che compongono
un totale, tra una parte e il totale,
, ma anche come, in
cambio, si possano perdere altre informazioni.
Consideriamo ad esempio l'incidenza della carne bovina sul totale
della carne consumata pro-capite. Impiegando rappresentazioni
percentuali possiamo dire che in 60 anni (dal 1926 al 1985) è
passata dal 47% al 32%. A prima vista si potrebbe concludere che è
diminuito il consumo di carne bovina, ma ciò non è
vero: si è passati dal consumo pro-capite di 10.1 kg all'anno
a quello di 25.1 kg all'anno (cioè, dividendo per 365, da 28 a
70 grammi al giorno).
Infatti se la parte percentuale diminuisce ma, nel
frattempo, aumenta il totale, il dato può
comunque
aumentare.
Abbiamo anche visto che dalla conoscenza del totale e della parte percentuale non si può ritrovare il valore esatto del dato. Infatti le percentuali vengono arrotondate con valori approssimati. [ voce "approssimazioni" de Gli oggetti matematici]
Per le statistiche valgono le osservazioni che abbiamo fatto più in generale per i modelli matematici: l'uso della matematica per analizzare un problema non basta per garantire l'esattezza dell'analisi poiché nel rappresentare una situazione con un modello matematico si scelgono solo alcuni aspetti tralasciandone altri, e anche gli aspetti presi in considerazione sono spesso rappresentati approssimativamente. [ voce "modello" de Gli oggetti matematici]
Abbiamo fatto queste osservazioni anche a proposito dei valori medi. Ad esempio il voto medio di matematica alla fine dell'anno in una classe può essere 6 e 1/2, ma è ben diversa la situazione in cui quasi tutti gli alunni abbiano 6 o 7 da quella in cui vi siano anche molti 4, 5 e 8.
In questa scheda discuteremo altri strumenti matematici impiegati nelle statistiche. Come argomento per le nostre esemplificazioni prenderemo i record sportivi.
1. Il salto
in alto - I grafici
source("http://macosa.dima.unige.it/r.R") # fig 1 anno = c(1912,1914,1924,1933,1934,1936,1937,1941,1953,1956,1957,1960,1960,1960, 1961,1961,1961,1962,1962,1963,1971,1973,1976,1976,1977,1978,1980,1980, 1983,1983,1984,1985,1985,1987,1988,1989,1993) cm = c(200,201,203,204,206,207,209,211,212,215,216,217,218,222,223,224,225,226, 227,228,229,230,231,232,233,234,235,236,237,238,239,240,241,242,243,244,245) c( min(anno),max(anno), min(cm),max(cm) ) # 1912 1993 200 245 # BF=6; HF=4.5 Plane(1910,2000, 0,245) Point(anno,cm,"blue") abovex("anni");abovey("cm") # # fig 2 Plane(1910,2000, 200,245) Point(anno,cm,"blue") abovex("anni");abovey("cm") # # fig 3 length(anno) # 37 Plane(1910,2000, 200,245) Point(anno,cm,"blue") abovex("anni");abovey("cm") for(i in 1:36) line( anno[i],cm[i], anno[i+1],cm[i],"brown") # # fig 4 Plane(1910,2000, 200,245) Point(anno,cm,"blue") abovex("anni");abovey("cm") polyl(anno,cm,"brown") #
2. Record maschili e femminili - I numeri indici e le variazioni percentuali
# fig. 5 anno = c(1932,1936,1940,1944,1948,1952,1956,1960,1964,1968,1972,1976,1980,1984,1988,1992,1996,2000,2004,2008,2012) cmm = c( 203, 207, 209, 211, 211, 211, 215, 222, 228, 228, 229, 232, 236, 239, 243, 244, 245, 245, 245, 245, 245) cmf = c( 165, 166, 166, 171, 171, 172, 176, 186, 191, 191, 194, 196, 201, 207, 209, 209, 209, 209, 209, 209, 209) c( min(anno),max(anno), min(cmm),max(cmm), min(cmf),max(cmf) ) # 1932 2012 203 245 165 209 Plane(1930,2012, 160,250) polyline(anno,cmm,"blue"); polyline(anno,cmf,"brown") pointV(anno,cmm,"blue"); pointD(anno,cmf,"brown") type(1987.5,204,"F"); type(1982.5,244,"M") # # fig. 7 length(anno) # 21 anno = c(1932,1936,1940,1944,1948,1952,1956,1960,1964,1968,1972,1976,1980,1984,1988,1992,1996) cmm = c( 203, 207, 209, 211, 211, 211, 215, 222, 228, 228, 229, 232, 236, 239, 243, 244, 245) cmf = c( 165, 166, 166, 171, 171, 172, 176, 186, 191, 191, 194, 196, 201, 207, 209, 209, 209) length(anno) # 17 cmM=NULL; cmF=NULL for(k in 1:17) {cmM[k] = cmm[k]/cmm[1]*100; cmF[k] = cmf[k]/cmf[1]*100} max(cmM); max(cmF) # 120.6897 126.6667 Plane(1930,1997, 100,128) polyline(anno,cmM,"blue"); polyline(anno,cmF,"brown") pointV(anno,cmM,"blue"); pointD(anno,cmF,"brown") type(1982.5,127,"F"); type(1982.5,114,"M") # # fig 9 anno = c(1932,1936,1940,1944,1948,1952,1956,1960,1964,1968,1972,1976,1980,1984,1988,1992,1996) cmm = c( 203, 207, 209, 211, 211, 211, 215, 222, 228, 228, 229, 232, 236, 239, 243, 244, 245) cmf = c( 165, 166, 166, 171, 171, 172, 176, 186, 191, 191, 194, 196, 201, 207, 209, 209, 209) Cmm=NULL; for(i in 2:17) Cmm[i] = (cmm[i]-cmm[i-1])/cmm[i-1]*100 max(Cmm[2:17]) # 3.255814 Cmf=NULL; for(i in 2:17) Cmf[i] = (cmf[i]-cmf[i-1])/cmf[i-1]*100 max(Cmf[2:17]) # 5.681818 BF=6; HF=3 Plane(1930,1997, 0,6) Point(anno[2:17],Cmm[2:17],"blue") polyl(anno[2:17],Cmm[2:17],"blue") Point(anno[2:17],Cmf[2:17],"brown") polyl(anno[2:17],Cmf[2:17],"brown")
3. Ancora sui
grafici - Le funzioni - Loro rappresentazione con software
4. Le tecniche e le attrezzature (approfondimenti)
# fig. 10 BF=6; HF=4.5 anno = c(1912,1920,1922,1923,1925,1925,1927,1928,1932,1935,1936,1937,1937,1940,1941, 1942,1957,1960,1961,1962,1962,1962,1963,1963,1963,1963,1964,1964,1966,1966, 1967,1967,1968,1969,1970,1970,1970,1972,1972,1972,1972,1975,1976,1976,1980, 1980,1980,1980,1980,1981,1981,1983,1983,1984,1984,1984,1984,1984,1985,1986, 1987,1988,1988,1991,1991,1991,1991,1992,1992,1992,1994,2014) m = c(4.02,4.09,4.12,4.21,4.23,4.25,4.27,4.30,4.37,4.39,4.43,4.54,4.54,4.60,4.72, 4.77,4.78,4.80,4.83,4.89,4.93,4.94,5.00,5.08,5.13,5.20,5.23,5.28,5.32,5.34, 5.36,5.38,5.41,5.44,5.45,5.46,5.49,5.51,5.54,5.55,5.63,5.65,5.67,5.70,5.72, 5.75,5.75,5.77,5.78,5.80,5.81,5.82,5.83,5.85,5.88,5.90,5.91,5.94,6.00,6.01, 6.03,6.05,6.06,6.07,6.08,6.09,6.10,6.11,6.12,6.13,6.14,6.16) Plane(1910,2015, 4,6.2) polyline(anno,m,"brown") abovex("anni"); abovey("m")
5. Esercizi
# ques. e19 spesa = c(1.94e3,2.09e4,1.96e5,2.04e6,2.19e3) retri = c(9.15e3,7.34e4,1.42e6,1.71e7,3.01e4) anni = c(1926,1945,1965,1985,2005) spesa/retri*100 BF=3.5; HF=3 Plane(1920,2010, 0,30) POINT(anni,spesa/retri*100,"black") polyl(anni,spesa/retri*100,"black") # # ques. e20 BF=3; HF=3 PLANE(-3,3, -3,3) x = c(1/2,-1/2,-1/2,1,1,-1,-1,1.5,1.5,-1.5,-1.5,2,2,-2,-2,2.5,2.5) y = c(1/2,1/2,-1/2,-1/2,1,1,-1,-1,1.5,1.5,-1.5,-1.5,2,2,-2,-2,2.5) polyline(x,y,"black") #