>>>>>

Scheda 5 - I teoremi limite

6. Confronto con le presentazioni (universitarie) standard (sigma-algebre, variabili casuali come funzioni, ecc.).

    Il modo in cui abbiamo introdotto i concetti probabilistici di base è diverso dal modo in cui usualmente vengono introdotti nei corsi universitari per "matematici".

    Ricordiamo assai sinteticamente (chi vuole può approfondire questi concetti su un manuale universitario di calcolo delle probabilità) che in genere si definiscono:

σ-algebra su un insieme A ogni insieme di sottoinsiemi di A chiuso rispetto all'unione numerabile e alla complementazione, e

spazio di probabilità ogni coppia (Pr,S) con S σ-algebra e, se A è l'insieme su cui S è σ-algebra, Pr funzione da S in [0,1] tale che Pr(A)=1 e, se Ai è una famiglia numerabile di elementi di S tra loro disgiunti, Pr(Ai)=ΣPr(Ai).

L'insieme A viene detto spazio degli eventi e i suoi elementi vengono detti eventi elementari . Gli elementi di S vengono detti eventi e Pr viene detta probabilità.

    Ad es. nel caso del lancio di un dado posso prendere {1,2,…,6} come A e tutti i sottoinsiemi di A come S. Se mi interessa solo studiare la parità delle uscite posso limitarmi a S={A,Ø,{1,3,5},{2,4,6}}; la probabilità che l'uscita sia pari o dispari è Pr({1,3,5}{2,4,6})=Pr(A)=1.

    Assai più complessa è l'interpretazione di questi concetti quando non si è nel caso discreto. È richiesta una definizione molto generale di misura – occorre almeno la misura di Lebesgue –, necessaria per misurare gli elementi di S che si possono ottenere nel caso in cui A sia un intervallo di numeri reali, cioè un segmento, una semiretta o una retta, o sia un rettangolo o ….

    Le variabili casuali vengono definite come funzioni che a eventi associano numeri reali. Nel caso del lancio di due dadi, possiamo considerare la funzione che ad ogni esito (m,n) associa il numero m+n. Il concetto di variabile casuale serve essenzialmente a dare forma numerica agli esiti di esperimenti di tipo non numerico. Precisando, nel caso dei due dadi avremmo lo spazio degli eventi A={(m,n) / m,n numeri naturali maggiori di 0 e minori di 7}, la σ-algebra S={sottoinsiemi di A}, la variabile casuale U definita come la funzione da A in R che a (m,n) associa m+n.

    Gli eventi che noi abbiamo indicato con U=x, U<x, … ora sarebbero {(m,n) / U(m,n)=x}, {(m,n) / U(m,n)<x}, … , anche se, in genere, questi eventi continuano a essere descritti con la stessa scrittura; ma in questo caso "U=x" sarebbe una abbreviazione di "{(m,n) / U(m,n)=x}", in cui "=" ha poco a che fare con l'usuale simbolo di eguaglianza.

    Nel caso del lancio di un dado, se interessa solo la parità degli esiti, invece di prendere S= {A,Ø,{1,3,5},{2,4,6}} e considerare Pr(X) solo per gli X in S, si può: prendere come S tutto {sottoinsiemi di A}; porre U(n) uguale a 0 se n è pari, uguale a 1 altrimenti; considerare Pr(U=0), cioè Pr({n / U(n)=0}, e Pr(U=1) invece di Pr({2,4,6}) e Pr({1,3,5}).

    Abbiamo scelto di non utilizzare questa impostazione, in particolare di considerare le variabili casuali come "speciali" variabili e gli eventi come condizioni piuttosto che come insiemi per vari motivi:

per un primo livello di approfondimento, in cui non si fa ricorso a concetti e teoremi di teoria della misura, questa trattazione è più "comoda" (sarebbe, comunque, formalizzabile nei vari dettagli e utilizzabile al posto della presentazione canonica);

consente di esprimersi in un linguaggio vicino a quello in cui, "in situazione", vengono usualmente formulati i problemi probabilistici; anche nelle modellizzazioni al computer gli eventi vengono presentati in forma "logica", non "insiemistica";

evita le difficoltà concettuali legate al chiamare "casuali" le variabili casuali, che, nell'impostazione standard, non hanno nulla di casuale: ad esempio la variabile casuale più impiegata è la funzione identità (nel caso del lancio di un dado, del tempo di attesa tra due arrivi a uno sportello, della misura di una grandezza fisica, … l'uscita è già numerica); «il termine "casuale" è usato meramente per ricordare che l'insieme [su cui è definita la funzione] è uno spazio di eventi» (dal noto manuale di analisi matematica di Apostol);

evita difficoltà concettuali e notazionali legate al fatto che al cambiare dello spazio di eventi cambia la misura di probabilità; in particolare non si può usare lo stesso simbolo Pr per rappresentare funzioni che hanno domini diversi; anche in molti manuali universitari si trovano, invece, espressioni del tipo "Pr(X<x, Y<y) = Pr(X<x)·Pr(Y<y)" dove la Pr a sinistra di "=" rappresenta un'altra funzione rispetto alla Pr a destra di "=" (e dove "Pr(X<x, Y<y)", che nella presentazione che abbiamo utilizzato nel corso diventerebbe Pr(X<x AND Y<y), è un'altra abbreviazione spesso non spiegata).

    L'impostazione richiamata in questo paragrafo ha anche lo scopo di formalizzare in modo unitario le variabili casuali. In particolare tutte le variabili casuali ammetterebbero funzione di ripartizione cumulata definita in R. Ad es. nel caso della variabile U dell'ultimo esempio (U vale 0 se l'uscita del dado è pari, vale 1 se è dispari) la funzione di ripartizione è:

  x 0
  x 1/2
  x 1

  se x<0
  se 0≤x<1
  se 1≤x

    (Pr(U≤x)=Pr({n/U(n)≤x})=Pr(Ø)=0),
    (Pr(U≤x)=Pr({2,4,6})=1/2),
    (Pr(U≤x)=Pr({1,2,…,6})=1).

 

    Ma per una trattazione unitaria esauriente è necessaria l'introduzione di un concetto più generale di integrale (integrale di Stieltjes), cosa che viene fatta solo in corsi universitari avanzati. Ad esempio esso serve per introdurre i concetti di media e varianza a partire dalla funzione di ripartizione cumulata, così da comprendere in un'unica trattazione variabili casuali discrete e continue, e anche casi di variabili né discrete né continue (ad es. alcune variabili a valori in un intervallo per le quali non esiste la funzione di densità).

<<<     Paragrafo precedente Paragrafo successivo     >>>