Quale matematica per i fenomeni casuali?
I primi strumenti per descrivere posizione e dispersione dei dati

Indice guide

Per questa scheda vedi anche la presentazione più estesa dello stesso tema presente negli Oggetti Matematici e gli esempi d'uso di WolframAlpha. La scheda sintetizza e rivede (usando altro software) alcune parti di un corso di aggiornamento di vari anni fa (vedi).

Il contenuto della scheda è scandito dai titoli dei paragrafi:  Una situazione problematica - Indici di posizione e di dispersione - Notazioni - Leggi di distribuzione (variabili discrete) - Leggi di distribuzione (variabili continue) - Approfondimenti

La scheda può essere anticipata rispetto alla scheda su Gli integrali; è eventualmente previsto l'uso di software per far fronte ad argomenti non ancora affrontati. Il paragrafo iniziale (§1) della successiva scheda su Il teorema limite centrale può essere anticipato, e svolto subito dopo questa scheda. Alcune parti di calcolo di derivate e integrali possono essere (in prima battuta) scaricate sul software (R o WolfamAlpha).

Gli istogrammi presenti nella scheda sull'asse verticale non rappresentano le frequenze ma le densità di frequenza (o frequenze relative unitarie), in modo che l'area totale di ciascun istogramma sia 1 = 100%.

1.1  Il primo paragrafo, riprendendo argomenti già introdotti nel primo biennio nella scheda Il calcolo delle probabilità (a cui si fa cenno nel §0). Vengono messi in luce gli errori che si commettono non tenendo conto della casualità dei tempi che passano tra una telefonata e la successiva e di quella dei tempi di durata delle telefonate, ossia schematizzando le situazioni con dei modelli deterministici. È un paragrafo "tecnicamente" molto semplice, ma concettualmente fondamentale, specie per un'area come la statistica, spesso ridotta all'uso, non compreso e a sproposito, di formulette.

1.2  Quesito 1: (20*60)/135 = 8.888…

1.3  Quesiti 2 e 3: per le risposte vedi i commenti che seguono i quesiti.

2.1  Il secondo paragrafo affronta il tema degli indici di posizione e dispersione. Per brevità non vengono discussi lo scarto assoluto medio e, nei paragrafi successivi, il coefficiente di asimmetria ed alcune proprietà della varianza, che, volendo, si possono ritrovare nella voce sugli "indici" presente negli Oggetti Matematici.

2.2  Quesito 4: da circa 55 a circa 15.

2.3  I quesiti 5 e 6 sono disussi poco dopo, nello stesso paragrafo.

3.1  Il terzo paragrafo introduce modi di rappresentare dati e calcoli che, poi, verranno consolidati attraverso l'uso.

4.1  Nel quarto paragrafo viene consolidato lo studio della variabili "discrete" (anche non "finite", come chiarito dall'esempio dei lanci della moneta). Esso fungerà anche da supporto per l'estensione dei concetti alle variabili "continue".

4.2  Se si vogliono richiamare esplicitamente situazioni in cui nel biennio si sono considerate somme infinite di numeri si vedano la scheda 2 de I numeri o Gli Oggetti matematici.

4.3  Quesito 7: 0.35*0 + 0.45*1 + 0.2*2 = 0.85.

4.4  Quesito 8: Vedi l'esercizio 3.11 qui.

5.1  Quesito 9. Il grafico è da fare a mano. Comunque, con R:
f <- function(x) 1/2+x-x; plot(f,1,2, ylim=c(0,0.6) )
abline(v=axTicks(1), h=axTicks(2), col="blue", lty=3); abline(h=0, col="red", lty=2)

5.2  Quesito 10. Il grafico è da fare a mano. Comunque, con R:
n <- 1e6; U1 <- runif(n)*2+1; U2 <- runif(n)*2+1; mean(U1+U2)
hist(U1+U2, probability=TRUE, col="grey90", n=100)
abline(v=axTicks(1), h=axTicks(2), col="blue", lty=3)
f <- function(x) -abs((x-4)/4)+1/2
plot(f, 2,6, add=TRUE, lty=2, col="red")

5.3  Quesito 11. Quesito su cui lasciare un po' riflettere gli alunni e, poi, da affrontare collettivamente con loro. Ecco diversi approcci con l'aiuto del computer. Con R:
# Sperimentalmente:
n <- 1e6; U <- runif(n)+runif(n)
hist(U, probability=TRUE, col="grey90",n=50)
abline(v=axTicks(1), h=axTicks(2), col="blue", lty=3)
m <- mean(U); V <- mean( (U-m)^2 ); s <- sqrt(V); m;V;s
# 1.000173 0.1667262 0.4083211
#
# Teoricamente:
f <- function(x) -abs((x-1))+1
plot(f, 0,2, lty=2, col="red")
integrate(f, 0,2)$value
# 1 (l'area sottesa e' 1)
g <- function(x) f(x)*x; integrate(g, 0,2)$value
# 1 (la media e' 1)
h <- function(x) f(x)*(x-1)^2; integrate(h, 0,2)$value
# 0.1666667
library(MASS); fractions( integrate(h,0,2)$value )
# 1/6 (la varianza e' 1/6)
sqrt(1/6)
# 0.4082483 (lo s.q.m.)

Con WolframAlpha, cerca triangular distribution e trovi:
mean = (max-min)/2 = 2/2 = 1
st.de. = (max-min)/(2*sqrt(6)) = 1/sqrt(6) = 0.4082483

6.1  Il paragrafo Approfondimenti illustra alcune proprietà della media e della varianza. Non è complicato, ma può essere in prima battuta saltato.

7.1  Quesito e1: Vedi l'esercizio 3.1 qui.

7.2  Quesito e2: Vedi l'esercizio 3.8 qui.

7.3  Quesito e3: Vedi l'esercizio 3a.1 qui.

7.4  Quesito e4: Vedi l'esercizio 3a.5 qui.

7.5  Quesito e5. Il problema è semplice, se viene l'idea .... Vediamo, prima, come affrontarlo statisticamente, con una simulazione, qui realizzata con R:
# algoritmo per generare in posizione casuale i numeri 1,2,...,N
ACASO <- function(N) {x <- NULL
x[1] <- floor(runif(1)*N+1); i <- 1
while(i < N) {ok=1; j <- floor(runif(1)*N+1)
for(k in 1:i) if(j==x[k]) ok=0
if(ok==1) {i <- i+1; x[i] <- j} }; x}
# Verifichiamone il funzionamento:
ACASO(10)
# OK # Calcolo su 5000 il numero medio dei numeri che "stanno al loro posto"
# (il numero I "sta al suo posto" se viene generato come I-esimo)
# Provo per diversi N:
N <- 2; volte <- 5000; n <- 0; x <- NULL
for (rip in 1:volte) {x <- ACASO(N); for(i in 1:N) if (x[i]==i) n <- n+1}
n/volte
N <- 3; volte <- 5000; n <- 0; x <- NULL
for (rip in 1:volte) {x <- ACASO(N); for(i in 1:N) if (x[i]==i) n <- n+1}
n/volte
N <- 4; volte <- 5000; n <- 0; x <- NULL
for (rip in 1:volte) {x <- ACASO(N); for(i in 1:N) if (x[i]==i) n <- n+1}
n/volte
N <- 5; volte <- 5000; n <- 0; x <- NULL
for (rip in 1:volte) {x <- ACASO(N); for(i in 1:N) if (x[i]==i) n <- n+1}
n/volte
In tutti i casi ottengo valori molto vicini ad 1. È facile convincersi che, qualunque sia N, il numero medio di lettere che vanno nella loro busta è 1. Vediamo come arrivare a questa conclusione "teoricamente".
    Sia X il numero di lettere che cadono nella loro busta. X posso pensarlo come X1+X2+…+XN dove Xi = 1 se la lettera i-esima viene inserita nella propria busta, Xi = 0 altrimenti.
    La probabilità che una lettera cada in una particolare busta è 1/N. Quindi, poiché  M(X) = M(X1+X2+…+XN) =  (vedi)  M(X1)+M(X2)+…+M(XN), ho M(X) = N·1/N = 1.
    La soluzione del quesito è bene, evidentemente, che sia discussa collettivamente.

7.6  Quesito e6. La varianza è già stata trovata alla fine del §4. L'obiettivo dell'esercizio è verificare la lettura della scheda, e la comprensione del concetto di scarto quadratico medio. Rifacciamo i calcoli con R:
library(MASS); n <- 1:6; v <- sum((n-3.5)^2)/6; fractions(v); sqrt(v)
#   35/12   1.707825

7.7  Quesito e7: Vedi l'esercizio 3.4 qui.

7.8  Quesito e8: Vedi l'esercizio 4.5 qui.

7.9  Quesito e9: Vedi l'esercizio 3.5 qui.

7.10  Quesito e10: vedi Gli Oggetti matematici.