I comandi di R impiegabili per una gestione in laboratorio di alcuni dei contenuti della scheda.
Le schede successive a "Le statistiche 3" in genere contengono informazioni per la gestione in laboratorio informatico dei contenuti.
Vedi qui per una guida all'uso di R (clicca "Command index" per un indice alfabetico)

Le statistiche
Alcuni modelli per la rappresentazione dei dati

Scheda 2
I record

0. Introduzione
1. Il salto in alto - I grafici
2. Record maschili e femminili - I numeri indici e le variazioni percentuali
3. Ancora sui grafici - Le funzioni - Loro rappresentazione con software
4. Le tecniche e le attrezzature (approfondimenti)
5. Esercizi

 

0. Introduzione

    Nella scheda 1 abbiamo considerato alcuni modelli matematici usati nelle statistiche.
    Abbiamo visto come con rappresentazioni grafiche e numeriche si possa facilitare il confronto tra dati diversi, tra le parti che compongono un totale, tra una parte e il totale, … , ma anche come, in cambio, si possano perdere altre informazioni.

    Consideriamo ad esempio l'incidenza della carne bovina sul totale della carne consumata pro-capite. Impiegando rappresentazioni percentuali possiamo dire che in 60 anni (dal 1926 al 1985) è passata dal 47% al 32%. A prima vista si potrebbe concludere che è diminuito il consumo di carne bovina, ma ciò non è vero: si è passati dal consumo pro-capite di 10.1 kg all'anno a quello di 25.1 kg all'anno (cioè, dividendo per 365, da 28 a 70 grammi al giorno).
    Infatti se la parte percentuale diminuisce ma, nel frattempo, aumenta il totale, il dato  può comunque aumentare.   [ voce "rapporto" de Gli oggetti matematici]

    Abbiamo anche visto che dalla conoscenza del totale e della parte percentuale non si può ritrovare il valore esatto del dato. Infatti le percentuali vengono arrotondate con valori approssimati.   [ voce "approssimazioni" de Gli oggetti matematici]

    Per le statistiche valgono le osservazioni che abbiamo fatto più in generale per i modelli matematici: l'uso della matematica per analizzare un problema non basta per garantire l'esattezza dell'analisi poiché nel rappresentare una situazione con un modello matematico si scelgono solo alcuni aspetti tralasciandone altri, e anche gli aspetti presi in considerazione sono spesso rappresentati approssimativamente.   [ voce "modello" de Gli oggetti matematici]

    Abbiamo fatto queste osservazioni anche a proposito dei valori medi. Ad esempio il voto medio di matematica alla fine dell'anno in una classe può essere 6 e 1/2, ma è ben diversa la situazione in cui quasi tutti gli alunni abbiano 6 o 7 da quella in cui vi siano anche molti 4, 5 e 8.

    In questa scheda discuteremo altri strumenti matematici impiegati nelle statistiche. Come argomento per le nostre esemplificazioni prenderemo i record sportivi.


1. Il salto in alto - I grafici

source("http://macosa.dima.unige.it/r.R")
 
# fig 1
anno = c(1912,1914,1924,1933,1934,1936,1937,1941,1953,1956,1957,1960,1960,1960,
       1961,1961,1961,1962,1962,1963,1971,1973,1976,1976,1977,1978,1980,1980,
       1983,1983,1984,1985,1985,1987,1988,1989,1993)
cm = c(200,201,203,204,206,207,209,211,212,215,216,217,218,222,223,224,225,226,
   227,228,229,230,231,232,233,234,235,236,237,238,239,240,241,242,243,244,245)
c( min(anno),max(anno), min(cm),max(cm) )
#    1912    1993         200    245
#
BF=6; HF=4.5
Plane(1910,2000, 0,245)
Point(anno,cm,"blue")
abovex("anni");abovey("cm")
#
# fig 2
Plane(1910,2000, 200,245)
Point(anno,cm,"blue")
abovex("anni");abovey("cm")
#
# fig 3
length(anno)
# 37
Plane(1910,2000, 200,245)
Point(anno,cm,"blue")
abovex("anni");abovey("cm")
for(i in 1:36) line( anno[i],cm[i], anno[i+1],cm[i],"brown")
#
# fig 4
Plane(1910,2000, 200,245)
Point(anno,cm,"blue")
abovex("anni");abovey("cm")
polyl(anno,cm,"brown")
#

2. Record maschili e femminili - I numeri indici e le variazioni percentuali

# fig. 5
anno = c(1932,1936,1940,1944,1948,1952,1956,1960,1964,1968,1972,1976,1980,1984,1988,1992,1996,2000,2004,2008,2012)
cmm = c( 203, 207, 209, 211, 211, 211, 215, 222, 228, 228, 229, 232, 236, 239, 243, 244, 245, 245, 245, 245, 245)
cmf = c( 165, 166, 166, 171, 171, 172, 176, 186, 191, 191, 194, 196, 201, 207, 209, 209, 209, 209, 209, 209, 209)
c( min(anno),max(anno), min(cmm),max(cmm), min(cmf),max(cmf) )
#    1932     2012         203      245       165     209
Plane(1930,2012, 160,250)
polyline(anno,cmm,"blue"); polyline(anno,cmf,"brown")
pointV(anno,cmm,"blue"); pointD(anno,cmf,"brown")
type(1987.5,204,"F"); type(1982.5,244,"M")
#
# fig. 7
length(anno)
# 21
anno = c(1932,1936,1940,1944,1948,1952,1956,1960,1964,1968,1972,1976,1980,1984,1988,1992,1996)
cmm = c( 203, 207, 209, 211, 211, 211, 215, 222, 228, 228, 229, 232, 236, 239, 243, 244, 245)
cmf = c( 165, 166, 166, 171, 171, 172, 176, 186, 191, 191, 194, 196, 201, 207, 209, 209, 209)
length(anno)
# 17
cmM=NULL; cmF=NULL
for(k in 1:17) {cmM[k] = cmm[k]/cmm[1]*100; cmF[k] = cmf[k]/cmf[1]*100}
max(cmM); max(cmF)
# 120.6897 126.6667
Plane(1930,1997, 100,128)
polyline(anno,cmM,"blue"); polyline(anno,cmF,"brown")
pointV(anno,cmM,"blue"); pointD(anno,cmF,"brown")
type(1982.5,127,"F"); type(1982.5,114,"M")
#
# fig 9
anno = c(1932,1936,1940,1944,1948,1952,1956,1960,1964,1968,1972,1976,1980,1984,1988,1992,1996)
cmm = c( 203, 207, 209, 211, 211, 211, 215, 222, 228, 228, 229, 232, 236, 239, 243, 244, 245)
cmf = c( 165, 166, 166, 171, 171, 172, 176, 186, 191, 191, 194, 196, 201, 207, 209, 209, 209)
Cmm=NULL; for(i in 2:17) Cmm[i] = (cmm[i]-cmm[i-1])/cmm[i-1]*100
max(Cmm[2:17])
# 3.255814
Cmf=NULL; for(i in 2:17) Cmf[i] = (cmf[i]-cmf[i-1])/cmf[i-1]*100
max(Cmf[2:17])
# 5.681818
BF=6; HF=3
Plane(1930,1997, 0,6)
Point(anno[2:17],Cmm[2:17],"blue")
polyl(anno[2:17],Cmm[2:17],"blue")
Point(anno[2:17],Cmf[2:17],"brown")
polyl(anno[2:17],Cmf[2:17],"brown")


3. Ancora sui grafici - Le funzioni - Loro rappresentazione con software

4. Le tecniche e le attrezzature (approfondimenti)

# fig. 10
BF=6; HF=4.5
anno = c(1912,1920,1922,1923,1925,1925,1927,1928,1932,1935,1936,1937,1937,1940,1941,
1942,1957,1960,1961,1962,1962,1962,1963,1963,1963,1963,1964,1964,1966,1966,
1967,1967,1968,1969,1970,1970,1970,1972,1972,1972,1972,1975,1976,1976,1980,
1980,1980,1980,1980,1981,1981,1983,1983,1984,1984,1984,1984,1984,1985,1986,
1987,1988,1988,1991,1991,1991,1991,1992,1992,1992,1994,2014)
m = c(4.02,4.09,4.12,4.21,4.23,4.25,4.27,4.30,4.37,4.39,4.43,4.54,4.54,4.60,4.72,
4.77,4.78,4.80,4.83,4.89,4.93,4.94,5.00,5.08,5.13,5.20,5.23,5.28,5.32,5.34,
5.36,5.38,5.41,5.44,5.45,5.46,5.49,5.51,5.54,5.55,5.63,5.65,5.67,5.70,5.72,
5.75,5.75,5.77,5.78,5.80,5.81,5.82,5.83,5.85,5.88,5.90,5.91,5.94,6.00,6.01,
6.03,6.05,6.06,6.07,6.08,6.09,6.10,6.11,6.12,6.13,6.14,6.16)
Plane(1910,2015, 4,6.2)
polyline(anno,m,"brown")
abovex("anni"); abovey("m")


5. Esercizi

# ques. e19
spesa = c(1.94e3,2.09e4,1.96e5,2.04e6,2.19e3)
retri = c(9.15e3,7.34e4,1.42e6,1.71e7,3.01e4)
anni = c(1926,1945,1965,1985,2005)
spesa/retri*100
BF=3.5; HF=3
Plane(1920,2010, 0,30)
POINT(anni,spesa/retri*100,"black")
polyl(anni,spesa/retri*100,"black")
#
# ques. e20
BF=3; HF=3
PLANE(-3,3, -3,3)
x = c(1/2,-1/2,-1/2,1,1,-1,-1,1.5,1.5,-1.5,-1.5,2,2,-2,-2,2.5,2.5)
y = c(1/2,1/2,-1/2,-1/2,1,1,-1,-1,1.5,1.5,-1.5,-1.5,2,2,-2,-2,2.5)
polyline(x,y,"black")
#