>>>>>

Scheda 4 - Funzioni di densità e di ripartizione

7. Suggerimenti e risposte ai quesiti

2

  Con #n=10 e #s=1.5811388, come "somma" (con [6,10] P Sum) ottengo lo stesso valore 193/512 ottenuto nella scheda 3 (§4).
Ricorrendo alla funzione G, posso calcolare l'area che è compresa tra il suo grafico e l'asse x e sta a destra della retta x=5.5. Potrei calcolare [5.5,10.5] con [5.5,10.5] G Int, ottenendo 0.3756627052. Con [5.5,20] G Int ottengo 0.3759148147. Con [5.5,100] G Int ottengo lo stesso valore. Posso ritenere che [5.5,∞] = 0.3759 (valore arrotondato).
    Col calcolo "esatto" ho 193/512=37.69…%, usando la gaussiana ho 37.59%. La differenza è trascurabile: la variazione relativa è 1/380, cioè circa del 3°/oo.

Torna al punto 2

3
e
4

  Possiamo limitarci a tracciare i grafici nel caso "media=0" in quanto gli altri si ottengono con una semplice traslazione.

g(x) = gauss
#m=0; #s=1; plot x:-4..4 y: g | 13
oo
#s=1.5; plot x:-4..4 y: g | 12
oo
#s=0.5; plot x:-4..4 y: g | 11
oo

    L'andamento dei grafici per σ diversi (vedi figura a lato) conferma il fatto che σ è un indicatore della dispersione. Al diminuire di σ il grafico si innalza e si restringe. Come indicatore della "larghezza" del grafico potremmo assumere la ascissa del punto di flesso destro.

    Il grafico della pendenza, realizzabile con Poligon, sotto riprodotto solo per σ=1, fa supporre che i punti di flesso (punti di estremo del grafico della pendenza) siano proprio in corrispondenza di x=–σ e x=σ.

  

  

n
#s=1; plot x:-4..4 y: g | 14
plot x: y: = deriv | 11
pp
oo

    Ciò può essere verificato calcolando e studiando la funzione derivata della densità gaussiana.

    Se calcoliamo l'area compresa tra grafico della densità gaussiana (con m=0), asse x e rette x=-σ e x=σ, per diversi σ POLIGON dà sempre il valore 0.6826895:
#s=1; [-#s,#s] g int
#s=3; [-#s,#s] g int
#s=0.4; [-#s,#s] g int

    Possiamo così precisare il senso in cui lo scarto quadratico medio, nel caso della densità gaussiana, è un indicatore della dispersione: (m–σ, m+σ) è l'intervallo in cui al 68.3% cade un'uscita.

Nota. Quando si conosca la funzione di ripartizione ( §5) o se ne abbia il grafico, il grafico della funzione densità può essere ottenuto con POLIGON tracciandone il grafico della pendenza.

  

A lato sono riprodotti i grafici della approssimazione della funzione di ripartizione gaussiana costituita dal grafico della frequenza comulata di MONET50 (vedi §1) e, su altre finestre, i grafici delle successive pendenze (derivate 1a, 2a e 3a): il primo è confrontabile/sovrapponibile all'istogramma di MONET50; gli altri due permettono, ad es., di individuare le posizioni dei punti di flesso della funzione di densità.

Torna al punto 3

Torna al punto 4

 

5

  Abbiamo visto che ( scheda 1, §7) il fenomeno è ben approssimato da una funzione di densità gaussiana. Utilizzando come media e scarto quadratico medio di questa densità la media e lo scarto quadratico medio statistici (calcolati con STAT: scheda 1, quesito 9), posso stimare con POLIGON le probabilità cercate calcolando gli integrali tra 80 e 110 (o un altro valore maggiore di 106, che era il valore massimo assunto da D-Telef2) e tra 30 e 60 della gaussiana con media w=49.34167 e s.q.m. v=19.1712.

Ottengo, rispettivamente, 5.4% e 55% ( scheda1, soluzione quesito 10).

Torna al punto 5

 h(x)=gauss
 #m=49.34167; #s=19.1712
 [80,200] h INT =
 [30,60] h INT =

6

   All'aumentare del numero degli intervallini la forma dell'istogramma cambia: aumenta il dislivello tra la colonna a destra e il resto dell'istogramma. Se aumentassi il numero delle prove, invece la media tenderebbe a stabilizzarsi intorno a 0.55. A fianco è riprodotto l'istogramma (non normalizzato) relativo a 1000 prove.

 

Torna al punto 6

7


  funzione densità [ d(x) = 1/pi*(1+x^2)) ]       funzione ripartizione [ f(x) = atn(x)/pi+1/2 ]

Nota. L'interpretazione geometrica della non esistenza della media della distribuzione di Cauchy a prima vista può lasciare perplessi: la figura delimitata dal grafico della funzione densità e dall'asse x, che ha area finita ed è simmetrica rispetto all'asse y, dovrebbe avere "baricentro" sull'asse y. Ma questa conclusione è frutto di un'ingannevole estensione al caso illimitato di una proprietà che varrebbe se la figura fosse limitata: se prendo un punto P sull'asse y non esistono i momenti rispetto a P delle due parti in cui la figura è divisa dall'asse y.

    Tracciato il grafico della funzione densità, POLIGON consente di tracciare direttamente il grafico della funzione di ripartizione:
tracciato il grafico di una funzione f tra a e b, tracciato un punto (a,h), si può ottenere, mettendo "=INTEGR" nel box "y" e cliccando [Plot], il grafico della funzione integrale x h +a x f  per x che varia tra a e b..

    Nel caso della distribuzione uniforme in [0,1], caso in cui, come il precedente, si saprebbe esplicitare facilmente la funzione integrale, definita ad es. come G la funzione densità (G(x)=1), si scelgono a=0 e b=1, se ne traccia il grafico e poi, con la trasformazione descritta sopra, dopo aver tracciato (0,0), si ottiene il grafico della funzione integrale. A destra, in alto, sono rappresentati il grafico della funzione densità (indicata con f) e quello della funzione di ripartizione (indicata con F). Ecco i comandi da tastiera per ottenere i due grafici sovrapposti (e ottimizzare la scala):
n
g(x)=1
plot x:0..1 y:g | 14
plot x:0 y:0
plot x: y:=integr | 11
pp
oo
-

    Nel caso della gaussiana, per ottenere il grafico a destra dovrei ma non posso scegliere a=-; osservo tuttavia che l'integrale tra -4 e 4 è praticamente 1, per cui il "contributo" delle x inferiori a -4 è trascurabile; posso quindi scegliere a=-4 e b=4.

 
      n
g(x)=gauss
#m=0; #s=1
plot x:-4..4 y:g | 14
plot x:-4 y:0
plot x: y:=integr | 11
oo
-y

Torna al punto 7

8

   È abbastanza intuitivo che la funzione densità f abbia grafico a forma di triangolo isoscele, in analogia al caso della variabile casuale U1+U2 con U1 e U2 variabili casuali discrete e uniformi a valori nello stesso insieme finito (come l'esito del lancio di due dadi: scheda2, §6). Con un ragionamento simile a quello impiegato per V=X·Y ( §5), si può dimostrare che f e la funzione di ripartizione F sono effettivamente quelle rappresentate graficamente qui sotto a sinistra.

    Lo studio sperimentale (con FA_RND.BAS e poi STAT, o direttamente con Stat: anche in questo caso basterebbe inserire RND+RND e cliccare [Imp]) consente comunque di dedurre facilmente qual è la funzione di densità (vedi fig. a lato). Affrontando lo studio di U1+U2 in una classe si scuola superiore sarebbe sufficiente tale approccio sperimentale per arrivare alla legge e, ad es., determinare il valore richiesto dal quesito: in base a considerazioni geometriche si trova facilmente che Pr(0.5<U<1.2) = (area del triangolo tra x=0.5 e x=1.2) = 0.5·(1+0.5)/2+0.2·(1+0.8)/2 = (0.75+0.36)/2 = 0.555.

Torna al punto 8

 

9

   Nel primo caso, devo studiare la variabile casuale HP che rappresenta l'altezza di una persona (dell'aggregato considerato) conoscendone la distribuzione sotto la condizione che la categoria C della persona sia "u" (la persona sia un uomo) e la distribuzione sotto la condizione che C="d" (la persona sia una donna). Nel secondo caso C può essere "u" (uomo) o "b" (bambino).

    La variabile casuale HP non è indipendente dalla variabile casuale C. Sia I un intervallo:

–  se C="u", HP si comporta come HU; cioè (HPI / C="u") equivale a HUI;

–  se C="d", HP si comporta come HD; cioè (HPI / C="d") equivale a HDI.

    Poiché HPI equivale a (HPI and C="u") or (HPI and C="d"), ho:

  

Pr(HPI) = Pr(C="u")·Pr(HUI) + Pr(C="d")·Pr(HDI) = 36%·Pr(HUI) + 64%·Pr(HDI)

I1 I2 I3 tot
u p1 p2 p3 100%
d q1 q2 q3 100%
     

Volendo, posso rappresentare la situazione anche con una tabella di contingenza: se classifico le altezze in tre intervalli, dalle tabelle di sinistra relative alle due sottopopolazioni passo alla tabella a destra e determino i valori da sostituire a ? sommando le righe "u" e "d".

    Poiché, se f è la funzione di densità della variabile continua U, Pr(UI) = a b f , posso dedurre che, se f, g e h le funzioni densità di HP, HU e HD:

f(x) = 36%·g(x) + 64%·h(x)

    Sotto è tracciato il grafico di f per la seconda situazione considerata nel quesito (HB al posto di HD). In questo caso siamo di fronte a una distribuzione bimodale (ha due massimi relativi). Per la prima situazione non si ottiene una distribuzione bimodale: il grafico di f è una curva a campana leggermente asimmetrica.

F(x)= 0.36G(x)+0.64H(x)
G(x) = gauss
#m=174.2; #s=7.1
H(x)=1/(sqr(2pi)*#v)exp(-(x-#w)^2/(2*#v^2))
#w= 132.4; #v= 5.6

Torna al punto 9

10

   La critica (1) alla "definizione classica" non ne mette a fuoco i due limiti principali:

  invece di rilevare che è un circolo vizioso definire un concetto ("probabilità") riferendosi al concetto stesso ("ugualmente possibili"), si osserva che "non sempre si è in grado di stabilire con certezza" se i casi sono "equiprobabili";

  invece di rilevare che la "definizione" è applicabile solo al caso finito, si osserva che spesso "è difficile o impossibile conoscere il numero dei casi favorevoli e quello dei casi possibili"; poi il "non poter conoscere" non inficia la definizione ma solo l'eventuale calcolo del rapporto.

    A proposito della critica (2) va osservato che la matematica dell'ultimo secolo (un secolo dopo Laplace), quella nata, grosso modo, quando ci si è posti il problema di dare una definizione autonoma di funzione (non più come "legge" – naturale o economica o …) non ha "sollevato obiezioni alla validità generale del principio di ragion sufficiente", ma lo ha considerato un principio non "matematico" in quanto riferito a considerazioni extra-matematiche: che cosa vuol dire "ragioni sufficienti" per il matematico?

Torna al punto 10

11

   La critica (1) alla "definizione frequentista" oscura la natura stessa del calcolo delle probabilità. Non "si mantengono" mai tutte "le stesse condizioni", altrimenti il fenomeno sarebbe "deterministico". L'esito del lancio di una moneta è completamente determinato da: la faccia a contatto con il pollice, la distanza del punto in cui l'unghia tocca la moneta dal centro di essa, l'impulso con cui colpisco la moneta, l'altezza dal piano di caduta, … ; è la carenza di conoscenze o la difficoltà pratica a valutare tutti i fattori che conduce a ritenere "casuale" un fenomeno.

    La critica (2) vuole essere "simpatica", forse per essere meglio recepita e compresa dagli alunni, … ma è "sbagliata": secondo questa critica non esisterebbero eventi di probabilità nulla.

Torna al punto 11

12

  Il quesito presenta due possibili critiche alla "definizione soggettivista".

    La (1) è tratta dal manuale di Gnedenko, uno dei migliori e più noti tra i testi "classici" di teoria della probabilità; non si vede come non essere d'accordo con essa, quanto meno se ci si riferisce alle presentazioni scolastiche della definizione soggettivista, come quella riprodotta, e alle presentazioni che in genere si trovano nei libri a carattere divulgativo, che, omettendo alcune condizioni essenziali (ad esempio la "coerenza" delle varie valutazioni probabilistiche di un soggetto) e astraendo dal contesto formale che inquadra l'approccio soggettivista, sono abbastanza caricaturali.

    L'obiezione (2) è di tipo generale è adeguata per tutte e tre le "definizioni" considerate finora.

Torna al punto 12

 

<<<     Paragrafo precedente INDICE Scheda successiva     >>>