La matematica tra gioco e realtà

Strategie, regole, scelte, fenomeni casuali, … e matematica

0.    Introduzione

1.    Giochi algebrici e geometrici

2.    Successioni e definizioni per ricorsione

3.    Calcolo combinatorio

4.    Dalla statistica alla probabilità

5.    Che cos'è la probabilità: misure di probabilità, eventi e variabili casuali

6.    Leggi di distribuzione. Il generatore di numeri pseudocasuali

7.    Modi per calcolare probabilità

8.    Eventi (probabilisticamente) dipendenti e indipendenti

9.    Usi (e limiti) del calcolo delle probabilità

10.  Esercizi

0. Introduzione

     In molti giochi e in molti sport è presente più o meno esplicitamente la matematica; la matematica interviene quasi sempre nella descrizione delle regole del gioco, nelle determinazione dei punteggi, … ; spesso si ricorre a conoscenze matematiche per scegliere mosse, strategie, …

     La matematica che interviene è la stessa che si impiega anche per affrontare situazioni "reali": per descrivere fenomeni, per valutare grandezze, per risolvere problemi, … . Del resto i giochi non sono tutti immaginari: molti hanno forti analogie con situazioni reali o riproducono in piccolo fenomeni reali.

     Fate e discutete esempi di giochi con le diverse caratteristiche sopra indicate.

     La matematica ha un ruolo fondamentale anche nella realizzazione dei videogiochi: la simulazione sia di giochi tradizionali (solitari con le carte, filetto, puzzle, scacchi, …) che di nuovi giochi o sport o situazioni "serie" (sci, calcio, giochi d'avventura, guida di automobile, guida di aereo, …) richiede la traduzione di figure, movimenti, comportamenti, … in termini algebrici e numerici "comprensibili" al calcolatore.

     In questa scheda affronteremo questa problematica rivedendo e ampliando l'uso di strumenti matematici già incontrati e introducendo nuovi concetti matematici.

1. Giochi algebrici e geometrici

     Il calcolo letterale, oltre che per rappresentare mediante equazioni, sistemi, … fenomeni reali, può essere usato anche per inventare o affrontare giochi.

     Nel paragrafo Esercizi della scheda 4 de Le statistiche (quesito 44) è illustrato e spiegato il "trucco" per avere successo in un gioco del tipo "indovino il numero che hai pensato".

  Spiega la strategia per aver successo nel gioco «pensa tre numeri naturali consecutivi, fanne il prodotto e aggiungi il numero centrale; dimmi quanto ottieni e ti so dire quali sono i tre numeri».

[traccia:

   indica con x il numero centrale

   indica con h il risultato fornito dalla persona che ha pensato i numeri (prodotto dei tre numeri aumentato del numero centrale)

   esprimi h in funzione di x tenendo conto che il primo e il terzo numero valgono x–1 e x+1: h=

   risolvi questa equazione rispetto a x (e, poi, calcola x–1 e x+1)]

     Vediamo, ora, un gioco in cui si indovinano due numeri.

  Andrea dice a Marco: «scegli due numeri naturali uno divisibile esattamente per l'altro, dimmi il quoziente e la differenza tra i due numeri, ti dirò quali numeri hai pensato». Andrea trova i numeri in questo modo (dove con Q e D abbiamo indicato il quoziente e la differenza):

  divide D per Q–1 ottenendo il più piccolo dei due numeri pensati

  moltiplicando tale numero per Q ottiene l'altro numero pensato.

(1)  Verifica con qualche prova che il trucco funziona.

(2)  Per spiegare perché il trucco funziona, avendo indicato con A e B i due numeri e tra-dotto i calcoli fatti da Marco nel sistema a lato, risolvi questo rispetto alla coppia (A,B):

     Consideriamo, ora, un indovinello:

«Tre fratellini dormono nella loro stanza. Durante la notte uno di loro si sveglia, si alza e sul tavolo della cucina trova un vassoio di cioccolatini, ne mangia un terzo e torna a dormire. Poco dopo si sveglia un altro fratello che, andato in cucina e visti i cioccolatini rimasti, ne mangia un terzo e ritorna a letto. Anche il terzo fratello si sveglia e si comporta come gli altri due: mangia un terzo dei cioccolatini che ha trovato in cucina. Al mattino nel vassoio vi sono 8 cioccolatini. Quanti ve n'erano la sera prima?»

  Prova a risolvere l'indovinello e, poi, confronta la strategia che hai impiegato con quelle usate dai tuoi compagni.

     Alcuni giochi si basano non sulla risoluzione di equazioni o sistemi, ma su dimostrazioni di proprietà dei numeri naturali. Consideriamo ad esempio il gioco seguente.

Gianni dice a Carla:

«Metti, di nascosto, un numero dispari di monete in una mano e un numero pari di monete nell'altra;  moltiplica per 2 il numero di monete che hai nella mano sinistra e per 3 il numero di quelle che hai nella mano destra; somma tra loro i due numeri trovati.

Se mi dici quanto hai ottenuto io indovino in quale mano hai il numero dispari di monete e in quale mano hai il numero pari.»

     Gianni "indovina" con questo trucco:

il numero nella mano destra è della stessa "parità" (pari o dispari) del numero finale ottenuto da Carla.

    Verifica con qualche prova che il trucco funziona.

            Completa, in modo che siano vere, le seguenti proposizioni (se possibile con "qualunque", altrimenti con "pari" o con "dispari"):

             (a)     se moltiplico per 2 un numero naturale                      ottengo un numero pari

             (b)    se moltiplico per 3 un numero naturale                      ottengo un numero pari

             (c)     se moltiplico per 3 un numero naturale                      ottengo un numero dispari

             (d)    se sommo un numero pari e un numero                     ottengo un numero dispari

             (e)     se sommo un numero pari e un numero                     ottengo un numero pari

            Completa la seguente dimostrazione che il trucco funziona in generale:

(1)  Se moltiplico per 2 il numero delle monete nella mano sinistra ottengo sicuramente, per (a), un numero M pari.

(2)  Se moltiplico per 3 il numero di quelle nella mano destra ottengo, per () e (), un numero N della stessa parità.

(3)  M+N, per (1), () e (), ha la stessa parità di N.

(4)  M+N, per (2) e (3), ha la stessa parità del numero di monete nella mano destra.

La dimostrazione della proprietà (a) del quesito 4 è immediata: i numeri naturali pari sono i multipli di 2.

    (b) può essere dimostrata così:

un numero pari è multiplo di 2, cioè è scrivibile come 2·k, con k numero naturale opportuno; se lo moltiplico per 3 ottengo 2·k·3, cioè 2·(k·3), che è multiplo di 2 e, quindi, è pari.

    Completa la seguente dimostrazione di (c):

un numero dispari è il successore di un numero pari, per cui può essere scritto come 2·k+1, con k numero naturale opportuno;  se lo moltiplico per 3 ottengo  (2·k+1)·3, cioè  2·k·3+3 = 2·k·3+2+1 = 2·(              )+1, che è il successore di un numero              e, quindi, è              .

    Nelle rubriche di enigmistica spesso sono proposti anche giochi di tipo geometrico.

     Vediamone uno.

Disegna un triangolo i cui lati passino per i punti indicati a lato in mo-do che ogni punto sia equidistante dai vertici del lato su cui si trova

     Per individuare un procedimento con cui costruire il triangolo conviene ragionare a "ritroso":

   partire da un triangolo ABC qualsiasi e tracciare tre punti X, Y e Z in modo che tra questo triangolo e i punti valgano le condizioni richieste (i lati siano tagliati a metà dai tre punti, cioè i tre punti siano i loro punti medi);

   trovare una relazione che associ ai tre punti il triangolo, utilizzabile poi per costruire un analogo triangolo a partire da tre altri punti qua-

lunque (e, quindi, anche dai punti assegnati dal gioco).

     L'illustrazione seguente descrive il ragionamento:

   traccio il triangolo (prima figura) e i punti medi X, Y e Z dei tre lati (seconda figura);

   poiché Z e Y distano da A la metà di quanto B e C distano da A posso concludere che ZY è ottenuto da BC mediante una trasformazione di scala (con fattore 1/2);

   analogamente posso concludere che XY e ZX sono ottenuti da AB e da AC mediante una trasformazione di scala (i tre segmenti ZY, XY e ZX sono tracciati nella terza figura);

   poiché le trasformazioni di scala (con lo stesso moltiplicatore delle x e delle y) trasformano rette in rette ad esse parallele, posso concludere che XY, YZ e ZX sono paralleli rispettivamente a AB, BC e CA.

              

        Dunque per costruire il triangolo richiesto dal gioco posso per ciascun punto tracciare la retta parallela al segmento che congiunge gli altri due punti e prendere come vertici del triangolo i punti di interse-zione delle tre rette così ottenute.

  Disegna nel riquadro soprastante il triangolo richiesto dal gioco.

Consideriamo un problema di contenuto analogo legato a una situazione più "concreta".

  Alberto vuole misurare l'altezza di un palo. Si pone davanti ad esso in modo che la sua ombra e quella del palo finiscano nello stesso punto P del terreno. Alberto misura la lunghezza della propria ombra (circa 2 m), poi quella del palo (circa 8 m) e conclude che il palo è alto circa 7 m.

         Qual è la strategia impiegata da Alberto?

         Quale altro dato ha utilizzato per ottenere la altezza del palo? 

         Qual è il valore di questo dato?

2. Successioni e definizioni per ricorsione

     In un cosiddetto "test di intelligenza" si trova la seguente domanda:

«Questi sono i primi sei numeri di una successione di numeri generati con una certa regola. Metti al posto dei puntini i numeri mancanti»

1       2            8       16    

     Per gli autori del test la risposta è:                 1       2       4       8       16     32

cioè la "regola" sarebbe:         (1)     scrivi 1

                                               (2)     scrivi il doppio del numero precedente

                                               (3)     vai a (2)

     Se indico gli elementi della successione con la variabile indiciata x(.), cioè indico con x(n) il numero al "posto n" della successione (numerando i posti a partire da 0), posso descrivere la successione così:

     x(0)=1, x(1)=2, x(2)=4, …

     In QB, per mettere in x(.) i primi 10 elementi della successione, da x(0) a x(9), tradurremmo la "regola" nel seguente programma:

         x(0)=1 : for n=0 to 8 : x(n+1)=x(n)*2 : next

     Aggiungendo:                                   FOR i=0 to 9 : PRINT x(i); : NEXT

  otterremmo come uscite:                   1 2 4 8 16 32 64 128 256 512

     Anche fuori da un linguaggio di programmazione, possiamo descrivere sinteticamente la successione nel modo seguente: 

x(0)=1 and x(n+1)=x(n)·2   (nÎIN)

o, più in breve:   o, anche:    x(0)=1, x(n+1)=x(n)·2

Scrivi i primi 10 elementi della successione:  y(0)=1, y(1)=2, y(2)=3, y(n+3)=y(n)·8    (nÎIN)

[esegui l'assegnazione  y(n+3)=y(n)·8  prima per n=0, poi per n=1, …]

     Quest'esercizio fa capire che non c'è un'unica regola per generare una successione che sia un completamento di:   1   2      8   16   … , anzi se ne possono inventare infinite altre.  Molto "intelligente" il test forse non è!

     La prima successione (1   2   4   8   16   32   ) può essere descritta più sinteticamente mediante un'unica formula: x(n)=2n  (20=1, 21=2, 22=4, …).   Ciò non accade, invece, per la seconda successione.

     Consideriamo il seguente problema:

«In un certo allevamento di animali il numero dei capi ogni anno aumenta mediamente di metà. Si vuole studiare l'aumento del numero di capi al passare del tempo (escludendo che si vendano o eliminino capi)».

     Per matematizzare il problema indichiamo con:

   H il numero iniziale di capi,

   con n il numero degli anni trascorsi e

   con P(n) la popolazione (cioè il numero dei capi) dopo n anni.

Completa il sistema a lato in modo che sia un modello matematico del nostro problema.

     Ovviamente questo modello matematico non rappresenta fedelmente la realtà: suppone che ogni anno l'aumento sia esattamente del 50% e che le condizioni dell'allevamento si mantengano inalterate senza limitazioni di tempo (non vi siano epidemie, non vi sia esaurimento delle risorse alimentari, …).

     Alcuni batteri in particolari condizioni si riproducono aumentando del 100% (cioè raddoppiando) ogni T minuti (con T numero fissato).

     Se indichiamo con H il numero iniziale di batteri, con n il numero degli intervalli di tempo di ampiezza T trascorsi (quindi n=1 dopo T minuti, n=2 dopo T·2 minuti, …) e con P(n) il numero di batteri dopo n in-

 

tervalli di tempo, possiamo descrivere lo sviluppo di questi batteri con il sistema a fianco:

   Invece del sistema precedente avremmo potuto utilizzare la formula:  P(n)=H·2n.  Calcolate P(3) sia utilizzando il sistema che utilizzando la formula e confrontate i risultati.    Spiegate perché le due definizioni sono equivalenti.

 

   Riferendoti all'allevamento considerato in precedenza, completa la seguente formula in modo che sia equivalente al sistema che hai completato nel quesito 9.             P(n)=H·…

     Le funzioni del tipo x  ax (con a>0) vengono dette esponenziali. Quindi n  2n e n  (1.5)n sono particolari funzioni esponenziali (con dominio ristretto a IN).

     Per questo, una popolazione che, all'aumentare del numero n di anni (o altri intervalli di tempo) trascorsi, cresca seguendo più o meno una relazione del tipo P=an si dice a crescita esponenziale.

     In certi periodi anche la popolazione umana (su tutta la terra o in particolari regioni) è cresciuta in modo esponenziale (ad es. a partire dal 1790 fino al 1860 la popolazione degli U.S.A. è cresciuta secondo la legge: P=3.1.35n dove P indica la popolazione in milioni e n il tempo trascorso in decenni).

     Le funzioni a input in IN (che sono rappresentabili, come abbiamo visto, mediante variabili indiciate) vengono chiamate anche successioni (come anche noi abbiamo già fatto più volte).

     Abbiamo visto che si possono definire funzioni di questo tipo oltre che mediante equazioni (x(n)=2n, z(n)=2n+1, P(n)=H·2n), anche mediante sistemi:

              x(0)=1, x(n+1)=x(n)·2           z(0)=1, z(n+1)=z(n)+2           P(0)=H, P(n+1)=P(n)·2

     Definizioni di quest'ultimo genere vengono chiamate definizioni per ricorsione o definizioni ricorsive. 

La parola ricorsione deriva dal fatto che questi sistemi contengono, oltre a equazioni (come x(0)=1, y(0)=1, y(1)=2, …) che permettono di determinare uno o più valori iniziali, equazioni (come x(n+1)=x(n)·2, y(n+3)=y(n)·8, …)  che possono essere ripercorse più volte per calcolare man mano tutti gli altri valori. A volte invece di "ricorsione" si usa "ricorrenza", che nel linguaggio comune ha un uso leggermente diverso (indica l'anniversario di un avvenimento o il ripetersi di un fenomeno nel corso del tempo).

     Come abbiamo visto (successione del quesito 8) non tutte le successioni definibili per ricorsione sono definibili anche mediante una sola equazione.

3. Calcolo combinatorio

   Una società sportiva vuole organizzare un torneo provinciale di pallavolo rivolto alle squadre delle scuole superiori. Deve decidere se scegliere un torneo a "eliminazione diretta" o un torneo "a classifica" (ogni squadra sostiene un incontro con ciascuna delle altre squadre e sulla base degli esiti degli incontri, dei punteggi, … viene stabilita una graduatoria senza ex aequo).

    Per fare ciò vuole sapere come il numero S delle squadre che possono essere ammesse dipende dal numero n delle "giornate" di durata del torneo (in una giornata vengono disputati contemporaneamente più incontri, ma ogni squadra disputa al più una partita).

    Stabilite come S varia in funzione di n nei due tipi di torneo.

Sul sistema di riferimento a fianco traccia i grafici delle due funzioni individuate nel quesito 12 (sono già tracciati i punti del grafico relativo al torneo a eliminazione diretta per n uguale a 0, 1,2 e 3).

   Se viene scelto il torneo "a classifica" articolato in 10 giornate (e quindi le squadre partecipanti sono 11) quante sono le possibili classifiche finali complete, dal 1° all'11° posto?

[osserva che, in pratica, devi trovare in quanti modi può essere ordinato un insieme di 11 elementi, e ricorda la definizione della funzione fattoriale: ®Modelli matematici per l'economia, p.17]

   Per costruire una codifica segreta dei testi che scrive al calcolatore, Fabrizio decide di stendere un programma per trasformare un file di testo in un altro che contenga gli stessi caratteri ma in posizioni diverse. L'idea che ha è la seguente:

   ogni carattere viene registrato in codice ASCII, cioè, in pratica, come un numero naturale tra 0 e 255 (®La automazione, scheda 3, p.8),

   quindi per costruire un codice segreto si può associare a ogni numero m tra 0 e 255 un altro numero n tra 0 e 255 in modo iniettivo (cioè in modo che due numeri diversi non vengano associati allo stesso numero) e modificare il file sostituendo il carattere di numero ascii m con quello di numero ascii n.

     Il programma codsegr.bas (tra il software del progetto) realizza un codice segreto di questo genere utilizzando la funzione iniettiva (da {0,1,,255} in {0,1,,255}) illustrata a fianco. Ecco un esempio di impiego:

    Descrivi mediante formule la funzione utilizzata dal programma.

    Descrivi un'altra funzione iniettiva da {0,1,,255} in {0,1,,255}

    Quante sono le funzioni iniettive da {0,1,,255} in {0,1,,255}?

   Nel caso del torneo del quesito 14, quanti sono i modi in cui possono essere vinte le medaglie d'oro, d'argento e di bronzo, cioè quante sono le possibili terne (1ª classificata, 2ª classificata , 3ª classificata) a cui possono dare luogo le 11 squadre partecipanti?

     Più in generale se ho n oggetti posso costruire n·(n1(n2) sequenze di lunghezza 3:  infatti ho n possibilità per la scelta del 1° oggetto, n1 possibilità per la scelta del 2° oggetto e n2 per la scelta del 3°.

     Il ragionamento è del tutto analogo a quello che abbiamo impiegato per introdurre la funzione fattoriale (®Modelli matematici per l'economia, p.17).

     Ancora più in generale, se ho n oggetti la quantità di sequenze di lunghezza k che posso costruire è:

n·(n1(n2)·…·(nk+1)

k fattori

cioè il risultato della moltiplicazione che ha come fattori i primi (in ordine decrescente) k numeri interi positivi minori o uguali a n.

     Tale prodotto viene in genere indicato con Dn,k o con D(n,k) in quanto le sequenze di lunghezza k realizzabili con n oggetti vengono chiamate anche disposizioni di n oggetti k a k: ogni sequenza è interpretabile come uno dei modi in cui posso "disporre" k oggetti scelti tra n.

   Puoi indicare in modo più breve D(n,n)?

        I modi in cui posso ordinare n oggetti, cioè le sequenze di lunghezza n che posso realizzare con n oggetti, vengono spesso chiamati anche permutazioni di n oggetti (il nome deriva dal fatto che nel linguaggio comune "permutare" è sinonimo di "riordinare"). Quindi le permutazioni di n oggetti sono n!.

   Quante sono le stringhe di lunghezza 4 formate da caratteri diversi che posso realizzare con le 52 lettere (a,b, …, z, A, …, Z) della tastiera?  E quelle realizzabili usando solo le lettere minuscole?

   Il torneo del quesito 14 viene svolto con le stesse modalità (11 squadre, torneo a classifica) nelle altre province della regione. Le prime 3 squadre classificate in ciascuna provincia disputano poi un torneo regio-nale. Quanti sono i modi in cui, in una data provincia, si può costituire il terzetto che passa al torneo regio-nale, cioè quanti sono i possibili insiemi di 3 squadre che si possono formare con le 11 squadre parte-cipanti? [prima di provare a rispondere rileggete la nota a p.3 della scheda 1 di Funzioni e equazioni]

     Le possibili terne di squadre (prima, seconda, terza) sono 11·10·9 (®quesito 16).

     I terzetti di squadre che potrebbero passare al torneo regionale sono molto meno.

     Infatti non ci interessa la graduatoria tra le prime 3 squadre: al variare di questa le squadre che passano sono sempre le stesse.

     Lo stesso terzetto di squadre {A,B,C} può essere disposto in 3! diverse graduatorie:

(A,B,C),  (A,C,B),  (B,A,C), (B,C,A),  (C,A,B),  (C,B,A).

     In altre parole uno stesso terzetto è conteggiato 3! volte tra le possibili terne (prima, seconda, terza).

Quindi:  n° dei terzetti = = = 11·5·3 =165

     Più in generale il numero dei sottoinsiemi di k elementi di un insieme di n elementi è pari al numero delle sequenze di k elementi che posso formare diviso per il numero dei modi in cui posso ordinare queste sequenze, cioè:

=  =  · · … ·

     I sottoinsiemi di k elementi di un insieme di n elementi vengono chiamati anche combinazioni di n elementi k a k.

     Il numero di tali combinazioni viene indicato  Cn,k  o  C(n,k)  o  .

   Una fabbrica produce 10 tipi di cioccolatini e li confeziona in scatole di 32 cioccolatini disposti su 4 file. In  ciascuna fila colloca cioccolatini dello stesso tipo. In quanti diversi assortimenti potrebbe confezio-nare i cioccolatini?

     Due persone giocano a ramino con un mazzo da 54 carte distribuendo 10 carte a testa e ammettendo il "colore" (cioè avere 10 carte tutte dello stesso seme) come condizione di "chiusura".

     Quanti sono gli insiemi di 10 carte di uno stesso seme, ad esempio del seme di cuori?

     Sono  C(13,10) = · · · · · · · · · .    Come mi conviene fare questo calcolo?

     A mano conviene, prima di eseguire operazioni, effettuare eventuali semplificazioni e manipolazioni (il risultato sappiamo che deve essere un numero intero in quanto rappresenta una quantità):

 · · · · · · · · · =  · · = 13·2·11 = 286

     Nel primo passaggio abbiamo semplificato i primi 7 numeri a denominatore con gli ultimi 7 numeri a numeratore, trasformando in pratica C(13,10) in C(13,3).

     Semplificazioni analoghe si possono fare anche in altri casi. Ad esempio C(20,16) può essere trasformato in C(20,4).

     Con una CT dotata del tasto  potrei calcolare immediatamente il prodotto dei numeri a denominatore in quanto è 10!, ma cosa potrei fare per i numeri a numeratore?  Un'idea è la seguente:

13·12·11·10·9·8·7·6·5·4 = =

In definitiva posso calcolare: 13! / 3! / 10!

   Quali tasti batteresti per calcolare C(20,16) con una CT di questo genere?

     Se calcolo C(82,30) con la CT, introdotto 82! ottengo un messaggio di overflow.  Per capire il perché calcolo alcuni valori della funzione fattoriale con grafun. Introdotta questa funzione (indicata con @F), tabulandola (con l'opzione "calc") ottengo:

     69 è il massimo numero di cui una CT riesce a calcolare il fattoriale: 70! ha ordine di grandezza superio-re a 100 e quindi richiede 3 cifre di esponente, eccedendo la capacità dei registri della CT. Grafun riesce a calcolare al massimo 142! (i valori di n! calcolati da grafun per n>50 sono approssimati con 4 cifre significative: vedi l'help).

     Un modo alternativo per calcolare C(n,k) è la costruzione del triangolo di Tartaglia (®Funzioni ed equazioni, scheda 2, ques.26). Ad esempio C(5,2) è il valore al posto 2 della riga 5 (k=2, n=5). Per la dimostrazione dell'equivalenza tra questo procedimento e i precedenti vedi il paragrafo Esercizi.

   Un antico quesito sul gioco degli scacchi chiede in quanti modi si possono disporre 8 regine su una scacchiera in modo che nessuna di esse risulti "attaccata" da un'altra (nessuna regina deve trovarsi sulla stessa riga o colonna o diagonale di un'altra regina). Noi lo semplifichiamo considerando, invece di 8 regi-

ne e di un'usuale scacchiera 8´8, 4 regine e una scacchiera  4´4.

   Per risolvere il problema potremmo provare (a mano o con un programma) a collocare sulla scacchiera le 4 regine in tutti i modi possibili e, via via, veri-ficare se sono soddisfatte le condizioni richieste. Ma questo procedimento sa-rebbe lungo. Infatti i modi in cui posso scegliere i 4 posti in cui collocare le regine sono molti. Quanti sono?

     Quante sarebbero nel caso del quesito originale?

   Provate, con tentativi ragionati, a risolvere il quesito (a lato è già indicata una collocazione accettabile delle 4 regine).

     La branca della matematica che si occupa dei modi in cui si possono formare nuovi oggetti (sequenze, insiemi, …) "combinando" gli elementi di un insieme finito viene chiamata matematica combinatoria (o calcolo combinatorio).

4. Dalla statistica alla probabilità

     Nei giochi e nella "realtà" spesso si hanno da fare scelte di cui non si sanno prevedere esattamente le conseguenze (quale carta conviene scartare? in quale orario conviene partire per incontrare meno traffico in autostrada? …) o, comunque, si hanno da affrontare fenomeni di cui non si sa prevedere esattamente lo sviluppo (l'uscita di un dado, l'evolvere del tempo atmosferico, …).   Abbiamo già incontrato alcune situa-zioni di questo genere nella scheda 3 de Le statistiche e nella scheda Modelli matematici per l'economia.

     In questo e nei prossimi paragrafi affronteremo lo studio degli strumenti matematici che permettono di razionalizzare le interpretazioni dei (e le scelte di fronte ai) fenomeni casuali, cioè di affrontarle ricorrendo alla ragione invece che affidandosi a pregiudizi, a superstizioni o al fato, come spesso accade.

     Prima di proseguire, rileggi le voci de Gli oggetti matematici da distribuzione a campionamento.

     Consideriamo la situazione:

(A)   Sto giocando a sette e mezzo e sono il primo di mano. Ho 1¨ e 3§. Mi conviene chiedere carta?

Sette e mezzo è giocato con un mazzo da 40, le figure valgono mezzo punto, le altre carte hanno il valore usuale; alla regina di cuori Q© (matta) il giocatore può assegnare, a piacere, un qualunque punteggio: 1, 2, …, 7 o mezzo punto. Ogni giocatore può chiedere una o più carte. Vince chi ottiene il punteggio più vicino (ma non superiore) a 7 e mezzo.

   Secondo voi, se chiedo carta è più probabile che sballi oppure che non sballi?

     Consideriamo un'altra situazione:

(B)   Un grande mobilificio del paese XX, rinnovando la gamma dei suoi prodotti, vuole adattare il "formato" di alcuni mobili (letti, poltroncine da scrivania, …) alle caratteristiche fisiche della popolazione attuale e, a tal fine, si avvale della consulenza della società statistica sifanstat.

    Questa utilizza come dati le misure delle altezze dei maschi ventenni rilevate alle visite di leva nel 1990 (cioè dei maschi nati nel 1970), classificate in intervalli ampi 1 cm. Nel paese XX, come accade in Italia, tutti i giovani vengono sottoposti alla visita di leva; le misure così rilevate sono gli unici dati antropometrici completi, su tutta la popolazione (maschile), di cui si può disporre per il paese XX.

     Per avere un'idea del tipo di studi che fa la sifanstat consideriamo un problema semplice. I letti ma-trimoniali prodotti finora dal mobilificio sono (internamente) lunghi 190 cm, adatti alla sistemazione como-da (tenendo conto dello spazio per il cuscino e per la rimboccatura inferiore) di un uomo alto meno di 183 cm. Utilizzando i dati sulle altezze citati, la sifanstat vuole valutare la probabilità che un potenziale cliente nato nel 1970 trovi i letti matrimoniali troppo corti.

     Sotto abbiamo riprodotto graficamente e parzialmente elaborato i dati citati, registrati nel file altxx.stf (nel directory sta).   Per esaminare i file possiamo ricorrere a un editor o esaminare i dati direttamente con il programma statfile  (attento: la tabella va letta riga per riga, non colonna per colonna).

                                                                                                            

     Le frequenze originali erano espresse percentualmente e arrotondate ai decimi (ad es. per l'intervallo [183,184) la frequenza relativa era 2.7%). Poiché statfile richiede che come frequenze siano introdotti numeri interi, i dati, nel file altxx.stf, sono stati riscritti in forma "per mille" (nel caso sopra citato si è introdotto, come frequenza assoluta, il numero 27).

     Analizzando il file otteniamo:

        

Nota.  Come numero totale dei dati il programma non visualizza 1000; ciò è dovuto al fatto che le frequenze originali erano arrotondate.

Il programma visualizza la scritta «non necessariamente di = ampiezza» per avvisare che, essendo stata scelta l'opzione "rettangoli con basi uguali", anche se gli intervalli registrati nel file avessero diverse ampiezze, il programma li rappresenterebbe con colonne di uguale larghezza (®distribuzione in Gli oggetti matematici).

     In assenza di ulteriori informazioni, la sifanstat assume che la probabilità che l'altezza cada in un dato intervallo coincida con la frequenza relativa di tale intervallo.

     Per es. assume che la probabilità che un cliente nato nel 1970 (ventenne nel 1990) sia alto 183 cm (misura troncata agli interi, cioè altezza in [183,184)) coincida con la frequenza 2.7% di tale altezza.

     Questa ipotesi presuppone, ad esempio, che i clienti non provengano da particolari regioni del paese: se nella regione AA i maschi adulti sono mediamente più alti rispetto all'intero paese, e se i clienti venissero tutti da AA, le valutazioni basate sui nostri dati sarebbero sballate. In altre parole, è come se si ipotizzasse che l'istogramma di distribuzione delle altezze dei clienti nati nel 1970 sia più o meno uguale all'istogramma relativo al totale dei maschi nati in XX in tale anno.

     Dunque, indicando con H l'altezza troncata ai centimetri di un potenziale acquirente nato nel 1970, con h un particolare numero naturale e con Pr(H=h) la probabilità che egli sia alto (troncando agli interi) h cm,  per la sifanstat:

Pr(H=h) = frequenza relativa dell'altezza h cm tra i ventenni nel 1990

     Dobbiamo calcolare  Pr(H=183 or H=184 or H=185 or ).

     Poiché la frequenza dell'unione di più classi disgiunte è, ovviamente, uguale alla somma delle frequenze delle singole classi, possiamo dire che:

Pr(H=183 or H=184 or H=185 or ) = Pr(H=183) + Pr(H=184) + Pr(H=185) +

       In altre parole devo calcolare l'area della parte tratteggiata dell'istogramma a lato, cioè la somma delle aree delle colon-ne che rappresentano le frequenze di [183,184), [184,185), …

   Utilizzando il file altxx.stf, riportato nella pagina precedente, calcola la probabilità cercata.

     Per determinare questa probabilità, in alternativa avremmo potuto, usando statfile, procedere per tentativi ricorrendo ai percentili:

     Avremmo potuto dedurre che Pr(H<183) è 87% (valore arrotondato).

  Come avremmo poi potuto calcolare Pr(H≥183)?

    A (7e) e B (mobilificio) sono situazioni in cui conosco già completamente la distribuzione delle grandezze considerate (valori delle carte o altezze).

     Ipotizzando che non ci siano motivi per cui debba venire una carta più che un'altra o per cui l'altezza di una persona abbia una qualche influenza sulla sua scelta di acquistare o no un letto presso il nostro mobi-lificio, ho assunto le frequenze relative come valutazioni di probabilità.

     Nel caso A i valori delle 38 carte rimanenti (tutte meno 1¨ e 3§) sono distribuiti secondo l'istogramma a fianco ("m" è la matta, Q©, e "f" indica il valore 1/2 attribuito alle figure diverse da Q©).

     Le carte che mi fanno sballare sono le 16 carte di valore maggiore o uguale a 4. La percentuale delle carte di valore maggiore o uguale a 4 è:

                                                                                                 =  42.1%

     Questa è la probabilità che il valore C della nuova carta sia maggiore o uguale a 4. In simboli:

Pr(C≥4)=42.1%

 x

 x

 x

 x

 x 22      16

 x

 x

 x x xxxx

 xxxxxxxx

 xxxxxxxx

xxxxxxxxx

mf1234567

     Questa è anche la probabilità di sballare. È minore del 50%. Quindi è più probabile che non sballi.

Nota. Giocando a "7e", e ad altri giochi, non si usa tuttavia solo la probabilità come criterio per decidere le mosse: ad esempio si può bluffare o, se si fanno delle scommesse, l'ammontare dell'eventuale vincita può influire sulla valutazione di che cosa è più conveniente fare.

     Anche nel caso B si sono fatte delle valutazioni probabilistiche riferite a un insieme finito (le altezze di una categoria di persone) di cui si conosceva la distribuzione percentuale.

     Consideriamo ora una situazione diversa.

(C)   Un amico mi dà un dado. Lo lancio. Esce 6. Posso ritenere che, se lo rilancio, l'uscita più probabile sia un altro 6?

  Discutete questo problema.

     Per verificare le opinioni emerse nel corso della discussione facciamo un esperimento.

  Ritaglia lo sviluppo del dado riprodotto in fondo alla pagina (dopo aver, eventualmente, fotocopiato la pagina). Poi incolla le linguette e costruisci il dado. Infine (per impedirne l'apertura durante i lanci) applica delle striscette di scotch sugli spigoli indicati, corrispondenti alle linguette. Effettua 100 lanci (tira il dado con una certa forza, in modo che rotoli più volte) registrando le uscite in una tabella.

     Raccogliete i dati registrati da tutti gli alunni in un'unica tabella, calcolatene la distribuzione percentuale e riportatela nella tabella seguente:

 

 

 

U=1

U=2

U=3

U=4

U=5

U=6

 

frequenza

assoluta

 

 

 

 

 

 

 

frequenza

relativa

%

%

%

%

%

%

 

 

 

Abbiamo indicato con U l'uscita del dado; quindi sotto a "U=1" scrivete la frequenza con cui si verifica l'eventualità che l'uscita sia 1, sotto a "U=2" scrivete …

 

     Costruite il corrispondente istogramma di distribuzione usando il sistema di riferimento a lato:

     Riprendiamo il problema C.

(1)   C'è chi sostiene che essendo già uscito 6 l'uscita successiva più probabile è di nuovo 6.

(2)   C'è chi sostiene che essendo già uscito 6 l'uscita successiva più probabile non è più 6.

(3)   C'è chi sostiene che ogni lancio fa storia a sé, per cui il fatto che sia già uscito 6 non mi dà alcuna informazione sulla maggior probabilità di un'uscita rispetto a un'altra.

     L'opinione (3) ha qualche fondamento: effettivamente ogni lancio fa storia a sé, cioè la nuova uscita non è influenzata dalla precedente. In particolare se è uscito 6 può, con la stessa probabilità del lancio pre-cedente, uscire nuovamente 6. Quindi l'opinione (2) è errata.

     Ma la seconda parte dell'opinione (3) («per cui …») non è giusta: l'uscita 6 mi dà qualche informazione. Infatti ad esempio mi permette di concludere che il dado non è truccato in modo tale che il 6 non esca mai, cioè che le uscite non si distribuiscano come nell'istogramma a fianco.

     L'opinione (3) sarebbe corretta anche nella sua conclusione se si sapesse che il dado è equo, cioè che le sue facce hanno tutte la stessa probabilità di uscita.

     Il dado dell'esperimento del quesito 27 non era equo. "Probabilmente" avrete ottenuto un istogramma somigliante a quello a fianco, che è il frutto di qualche centinaia di lanci di un dado costruito in modo analogo ai vo-stri.  L'istogramma ci fa ritenere che si tratti di un dado per cui U=6 è più probabile di U=1, U=2, …, U=5.

     Se si sapesse che il dado è equo, l'opinione (1) sarebbe scorretta. Ma non avendo alcuna informazione sul dado e non avendo fiducia sulla sua equità, è sensato "puntare" sul 6 piuttosto che su un'altra faccia.

     Come si fa a stabilire l'equità di un dado?

     Per costruire un dado equo occorre impiegare un materiale omogeneo, dargli forma regolare, … .  Il no-

stro dado è evidentemente non equo: la presenza di linguette e pezzi di scotch più su certe facce che su altre fa sì che esso non sia equilibrato.

     Per assicurarsi dell'equità di una dado occorre tuttavia fare anche una verifica sperimentale: sottoporre il dado a moltissimi lanci e controllare se l'istogramma di distribuzione delle uscite tende a stabilizzarsi su una forma come quella a lato, con 6 colonne di eguale altezza.


     In ogni caso non potremo avere una certezza assoluta dell'equità del dado. Anche se il dado è realmente equo, noi, essendo in grado di effettuare solo una quantità finita di prove, non potremo mai concludere che l'istogramma sperimentale tende effettivamente a stabilizzarsi su un insieme di colonne di altezza uguale. Potremo solo valutare la probabilità che ciò accada.

     Ad esempio, se il dado fosse equo, con 1 milione di lanci potremmo concludere che al 99% la probabilità che esca 2 è compresa tra 0.166 e 0.168, con 100 milioni potremmo concludere che al 99% è compresa tra 0.1666 e 0.1668, … , ma non arriveremo mai né alla certezza, né a tutte le cifre di 1/6=0.1.

     Nei prossimi anni studierai concetti che ti permetteranno di esprimere meglio ciò che qui si è descritto con «tende a stabilizzarsi» e a valutare la probabilità degli scarti tra valori teorici e valori sperimentali.

     Anche nel caso delle altezze di una popolazione di persone, quando non si conoscano tutti i dati, si ricorre a uno studio sperimentale della distribuzione analogo a quello visto per il dado: si effettua un campionamento (®Gli oggetti matematici) e si esamina la distribuzione delle altezze del campione. Più il campione è numeroso più l'istogramma si avvicina a (cioè meglio approssima) l'istogramma dell'intera popolazione.

     A differenza della distribuzione delle uscite del dado, il cui l'istogramma "limite" è puramente teorico (i lanci effettuabili sono infiniti, almeno se il dado non si consuma, se …), nel caso delle altezze l'istogram-ma limite corrisponde all'istogramma "sperimentale" che otterrei esaminando l'intera popolazione (esame in via di principio realizzabile in quanto la popolazione è finita).

     Un altro caso di uso di dati sperimentali per valutare delle probabilità è quello in cui si ricorre a dati relativi a come un fenomeno si è realizzato in tempi precedenti per prevedere come esso si realizzerà in un tempo futuro. Consideriamo ad esempio la seguente situazione:

(D)   Gli insegnanti di matematica e di fisica della scuola X, per programmare le attività del nuovo anno, vogliono stimare quanti studenti parteciperanno ai corsi di recupero. A tal fine chiedono alla segreteria una statistica sulle insufficienze in queste materie che vi sono state nel primo quadrimestre dell'anno passato. La segreteria fornisce le percentuali degli studenti con insufficienze in matematica (42%), in fisica (39%) e in entrambe le materie (28%). Utilizzando queste percentuali come valutazioni delle probabilità che uno studente risulti insufficiente in tali materie nel nuovo anno, come si può valutare la probabilità che uno studente debba essere coinvolto in corsi di recupero per queste materie?

  Rispondi alla domanda posta in D aiutandoti con i diagrammi seguenti (M e F indicano gli insiemi degli studenti con insufficienza in, rispettivamente, matematica e fisica).

     Consideriamo ora una valutazione probabilistica in cui non ha neanche senso porsi il problema di uno studio sperimentale:

(E)    Sta per disputarsi la partita Roma-Torino. Gigi ritiene che la Roma 30 su 100 vincerà e 40 su 100 pareggerà. Qual è la probabilità per Gigi che vinca il Torino?

  Rispondi alla domanda posta in E.

     E è una situazione diversa dalle precedenti: non abbiamo a che fare con una frequenza, anche se ci si esprime con il linguaggio "delle frequenze" («30 su 100», …).

     Infatti Gigi valuta la probabilità di vittoria in base alle sue valutazioni sullo stato di forma delle due squadre, sulle condizioni di salute dei giocatori, … e in base alle sue speranze.

     Avrebbe senso ricorrere a una valutazione basata sulle frequenze solo se non si disponesse di infor-mazioni sull'andamento del campionato, non ci si basasse sulle proprie aspettative, … e se si avessero a disposizione i risultati degli incontri precedenti tra le due squadre.

5. Che cos'è la probabilità: misure di probabilità, eventi e variabili casuali

     Riprendiamo, in breve, alcuni degli esempi visti.

   Nella situazione B come probabilità Pr(H=h) ho assunto la frequenza relativa con cui si presenta l'altezza h tra i maschi dell'età considerata. Utilizzando questi valori di probabilità ho calcolato altri valori di probabilità.  Ad esempio:

Pr(H≥183) = Pr(H=183)+Pr(H=184)+Pr(H=185)+…

     Se invece sapessi che Pr(H<183)=87% per trovare Pr(H≥183), potrei osservare che  H≥183  equivale a  not H<183  (il verificarsi di  H≥183  equivale al non verificarsi di  H<183). Quindi:

                                      Pr(H≥183) = 100% – Pr(H<183) = 100% – 87% = 13%

   La situazione E, indicando con E l'esito ("1", "2" o "X") della partita, può essere sintetizzata così:

assumendo che Pr(E="1")=30% e che Pr(E="X")=40%,  quanto deve valere Pr(E="2")?

     Poiché  Pr(E="1")+Pr(E="2")+Pr(E="X")=100%, deduco che:

Pr(E="2")=100%–Pr(E="1")–Pr(E="X")=100%–30% – 40% = 30%

   Nel caso del lancio di un dado, ritenere il dado equo significa supporre che l'uscita U abbia uguale pro-babilità di essere 1, 2, … o 6: Pr(U=1)=Pr(U=2)=…=Pr(U=6).    Sia p il valore di questa probabilità.

     Poiché  Pr(U=1)+Pr(U=2)+…+Pr(U=6)=100%=1,  ho  p+p+…+p=6p=1, da cui p=1/6.

     Cioè:  Pr(U=1)=Pr(U=2)=…=Pr(U=6)=1/6

     Per trovare la probabilità che l'uscita sia pari faccio:

Pr(U è pari) = Pr(U=2)+Pr(U=4)+Pr(U=6)= + + =  =  .

     Nelle prime due situazioni ho associato ad alcuni eventi A un numero compreso tra 0 e 1 (=100%) come Pr(A) (probabilità di A).  Nella terza situazione ho fissato delle condizioni sulla funzione A Pr(A): ho supposto che Pr(U=1)=Pr(U=2)=….

     In tutti e tre i casi ho poi dedotto le probabilità relative ad altri eventi applicando a Pr alcune delle proprietà che si erano già usate per le frequenze percentuali.

     Rivediamo più sistematicamente queste proprietà.

Pr(not A) = 100% – Pr(A)

Pr(A or not A) = 100% = 1

Pr(A and not A) = 0

Esempio:  Pr(H≥183) = Pr(not H<183) = 100% – Pr(H<183)

Pr(A1 or A2 or A3 or ) = Pr(A1) + Pr(A2) + Pr(A3) + …

          se A1, A2, A3,… sono tra loro incompatibili, cioè se due qualun-       que eventi Ai e Aj non possono essere veri contemporaneamente.

Esempio:  Pr(U è pari) = Pr(U=2 or U=4 or U=6)= Pr(U=2)+Pr(U=4)+Pr(U=6)

     Quest'ultima proprietà è nota come proprietà additiva.

Una proprietà analoga vale per le aree: se unisco dei po-ligoni l'area della figura ri-sultante è la somma delle lo-ro aree solo se essi non sono sovrapposti [®La matem. e lo spazio, scheda 2, ques. 49]

   Nel caso D, per valutare Pr(SÎM or SÎF) (probabilità che uno studente S sia tra gli studenti insuffi-cienti in matematica o tra gli studenti insufficienti in fisica), non ho potuto usare la proprietà additiva poiché si può essere insufficienti in entrambe le materie. Ho fatto:

Pr(SÎM or SÎF) = Pr(SÎM) + Pr(SÎF) – Pr(SÎM and SÎF)

     Più in generale, quando si è di fronte a valutazione del tipo Pr(evento1 or evento2) con evento1 e evento2 non incompatibili, si usa la proprietà:

Pr(A or B) = Pr(A) + Pr(B) – Pr(A and B)

     A seconda di come si scelgono le valutazioni iniziali, per la stessa situazione si possono ottenere diverse misure di probabilità.

     Ad es. nel caso E (partita Roma-Torino) se Gigi avesse dato la vittoria della Roma al 35% e il pareggio al 50%, invece della misura di probabilità:     "1"  30%          "X"  40%                                                               "2"  30%

avremmo avuto quest'altra:                             "1"  35%          "X"  50%         "2"  15%

     Le valutazioni iniziali possono essere dedotte dall'esperienza o da considerazioni di tipo fisico o da propri convincimenti o … .

     Devono comunque essere tali da non condurre a contraddizioni: a partire da esse, applicando ripetutamente le proprietà elencate, non posso ottenere due valutazioni diverse per uno stesso evento, non posso ottenere probabilità negative o superiori al 100%, …

     Ad esempio (situazione E) non si può stimare che la Roma vincerà al 40% (Pr(E="1")=0.4) e che pareggerà al 70% (Pr(E="X")=0.7), poiché avremmo Pr(E="2")=1–(0.4+0.7)=–0.1 invece di un valore maggiore o uguale a 0.

  Dopo aver specificato che cos'è una misura di probabilità, dobbiamo precisare meglio che cosa sono gli eventi.

     Sono di fronte a un fenomeno, ad esempio il lancio di un dado, determinato da molti fattori,

alcuni dei quali (la forma del dado, il peso del dado, …) riesco a valutarli, cioè li so individuare, ho gli strumenti per misurarli, non è troppo dispendioso rilevarli, …,

altri no (l'impulso che dò al dado, la presenza di correnti d'aria, ).

     Questi ultimi fattori, per convenzione, li chiamo casuali.  È una scelta soggettiva, che dipende dallo stato di conoscenze, dal tempo e dalle risorse che voglio dedicare all'analisi del problema, … : disponendo di strumenti sofisticati potrei misurare l'impulso che dò al dado, valutare la presenza di correnti d'aria, ….

     Chiamo fenomeno (o esperimento) casuale un fenomeno di cui considero casuali alcuni fattori. Chia-mo condizioni l'insieme dei fattori che riesco a valutare. Dunque, a parità di condizioni, il fenomeno può realizzarsi diversamente; in altre parole, più prove dell'esperimento possono dar luogo a risultati diversi.

     Chiamo deterministico un fenomeno che non dipende da fattori casuali.

     Ad esempio la misura della lunghezza di un tavolo troncata ai centimetri è un fenomeno deterministico: ogni volta che ripeto la misura ottengo sempre lo stesso valore.

     Invece una misura di tempo troncata ai centesimi di secondo effettuata manualmente con un orologio di-gitale (®quesito 32 della scheda 3 de Le statistiche) è un fenomeno casuale: il valore che ottengo dipende anche dai tempi di reazione della persona, che sono casuali (variano da momento a momento in relazione alla attenzione, alla stanchezza, …).

     Nel caso della situazione B, il fenomeno casuale è l'altezza del potenziale cliente nato nel 1970 che visita il mobilificio, la condizione è l'età del cliente, i fattori casuali sono moltissimi, per es. le esigenze di arredamento, le possibilità economiche, … dei vari abitanti del paese XX.

     Nel caso del lancio di un dado le condizioni, come già osservato, sono le caratteristiche fisiche del da-do, il fatto che il dado cada sulla tavola, …, i fattori casuali sono l'altezza da cui lancio il dado, la posizione del dado nella mia mano, l'impulso che gli dò, la rugosità e l'inclinazione della superficie della tavola, la presenza di correnti d'aria, … .

     In entrambi i casi i fattori "casuali" potrebbero essere teoricamente ridotti o eliminati: nel primo caso potrei conoscere, ad esempio attraverso delle interviste telefoniche, le caratteristiche fisiche e anagrafiche delle famiglie del paese XX che intendono rinnovare l'arredamento; nel secondo caso potrei misurare l'altezza da cui lancio il dado, l'impulso del lancio, …

     Anche nel caso della situazione A potrei ridurre i fattori casuali: basterebbe aver dato una "sbirciata" alle carte degli altri giocatori (in modo da restringere l'insieme della carte "possibili") o addirittura alla prima carta del mazzo: in questo caso lo sballare o no diventerebbe un fenomeno deterministico.

     Un evento è un fatto che riguarda un fenomeno casuale; ogni volta che, a parità di condizioni, il fenomeno si realizza, l'evento può verificarsi o no.  Ad esempio:

   nel contesto del lancio di un dado, un evento può essere "esce la faccia del dado con 4 pallini";

   nel contesto del "mobilificio" un esempio di evento è "arriva un cliente alto 181 cm";

   nel contesto del lancio di una coppia di dadi possiamo considerare come evento "escono due facce contenenti complessivamente 8 pallini".

     Passando al modello matematico, rappresentiamo il fenomeno casuale individuando uno o più og-getti matematici che rappresentino le grandezze o gli aspetti attraverso cui si manifesta il fenomeno:

   nel caso dell'arrivo del cliente ci interessa rappresentare la sua altezza, e possiamo farlo considerando il numero che ne è la misura in una fissata unità;

   nel caso del lancio di una coppia di dadi possiamo considerare i due numeri che indicano le quantità dei pallini che compaiono sulle due facce che escono.

     Questi oggetti matematici li indichiamo con delle lettere o dei nomi, così come si fa per le variabili nelle formule che descrivono fenomeni deterministici, e per questo vengono chiamati variabili casuali.

     Si è già usata questa notazione negli esempi visti:

   C (a valori in {1/2,1,2,…,7}) per indicare il valore della nuova carta,

   H (a valori negli interi positivi) per indicare l'altezza del potenziale cliente nato nel 1970,

   U (a valori in {1,2,…,6}) per indicare l'uscita del dado lanciato,

   E (a valori in {"1","2","X"}) per indicare l'esito della partita,

  

     Dall'evento come fatto che riguarda il fenomeno, nel modello matematico si passa all'evento come condizione in cui compaiono variabili casuali riferite al fenomeno in questione:

                 H≤183                E="1"orE="X"              SÎM or SÎF            U= 6

  Descrivi matematicamente l'evento che lanciando due particolari dadi esca (complessivamente) 7 utilizzando le variabili casuali U1 e U2 per indicare le uscite dei singoli dadi.

          Descrivi poi, analogamente, l'evento che l'uscita del lancio dei due dadi sia pari.

6. Leggi di distribuzione - Il generatore di numeri pseudocasuali

     Qbasic è dotato di un "fenomeno casuale".

     Se proviamo ad eseguire il programma ad una riga:

FOR I=1 TO 10 : PRINT RND : NEXT

otteniamo le uscite a lato.

     La parola chiave RND indica una funzione a cui l'utente (come accade con TIMER e TIME$: ®La automazione, scheda 3, p.30) non deve fornire input:

è QB stesso che, ogni volta che incontra rnd nel corso dell'esecuzione, le assegna automaticamente (in funzione del suo stato interno, dell'evolvere dell'esecuzione, …) un output maggiore o uguale a 0 e minore di 1.

     rnd sembra comportarsi come un fenomeno casuale. Per esaminarne il comportamento mediante stat-file posso usare un programma come quello parzialmente riprodotto sotto, registrato in macosa come fa_rnd.bas  (il nucleo essenziale del programma è costituito dalle righe 26-31).

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

' Programma da completare per costruire file che rappresentino fenomeni

' casuali analizzabili con STATFILE. Il directory corrente e` STF.

' ** Nel sottoprogramma PROVA devi mettere una o più righe che assegnino a U

' il dato che man mano vuoi mettere nel file.

' Ad es. per l'esito del lancio di due dadi 'equi' puoi mettere:

'    U1 = FIX(X*6)+1 : U2 = FIX(X*6)+1

'    U = U1 + U2

' oppure:

'    U = FIX(X*6) + FIX(X*6) + 2

' ** se vuoi prendere a caso la successione di numeri pseudocasuali togli

' l'apice dalla riga seguente:

'RANDOMIZE TIMER

PRINT : COLOR(11)

PRINT "Finito l'uso del programma, non registrare le modifiche (o registra"

PRINT "il programma con un nuovo nome." : COLOR(10)

PRINT "Hai letto i commenti presenti nella lista del programma e modificato"

INPUT "PROVA e le assegnazioni a nome$, commento$, n.dati  (s/n)"; risp$

IF UCASE$(risp$) <> "S" THEN END

 

GOSUB Percorso1                  ' Assumo STF come directory corrente

INPUT "nome del file (suggerimento: scegli 1,2, ... o 9)"; nome$

INPUT "eventuale commento"; commento$

INPUT "n.dati"; n.dati

OPEN nome$+".stf" FOR OUTPUT AS #1

GOSUB Percorso2                  ' Ritorno al directory corrente iniziale

PRINT #1, "'" + commento$

PRINT #1,"dati"

PRINT #1,n.dati

FOR i=1 TO n.dati

  CALL Prova(U) : PRINT #1,U

NEXT

CLOSE #1

 

PRINT "Il file e` stato generato"

...

     Mi propongo di generare 1000 numeri con RND:

per completare il sottoprogramma (®La automazione, scheda 4, §5) prova devo aprire il menu Visualizza e azionare Subs; compare una finestra di dialogo da cui posso selezionare o il "programma principale" o il sottoprogramma;  aperto il sotto programma, lo completo nel modo a fianco:

SUB PROVA(U)

U=RND

END SUB

1 come input a nome$, 1000 come input a n.dati e, se voglio, 1000 rnd a commento$; il file sarà registrato come 1.stf nel directory corrente di StatFile.

     Sotto sono riprodotti gli output dell'analisi mediante statfile del file così generato.

     I 1000 valori generati da rnd hanno come media 0.491…, cioè circa 1/2. Anche la mediana (50° percentile) è circa 1/2.

     L'istogramma è stato realizzato scegliendo la classificazione in 20 sottointervalli di [0,1).

     Dall'istogramma si vede che i valori assunti da rnd nel corso dell'esecuzione si distribuiscono abbastanza uniformemente in [0,1): le colonne hanno tutte altezza abbastanza vicina a 5%.

     Ciò può essere dedotto anche dall'analisi dei percentili:  il primo 25% dei dati cade in [0,0.259…), che è circa 1/4 dell'intervallo, il primo 50% dei dati cade in [0,0.478…), che è circa 1/2 dell'intervallo, …

     Riducendo il numero dei sottointervalli il dislivello relativo tra le colonne si riduce. Sotto sono riprodotti gli istogrammi relativi alle scelte "10 classi" e "2 classi".

          Se generassimo più valori di rnd e li analizzassimo statisticamente otterremmo istogrammi dal contorno superiore più piatto.

          Aumentando ulteriormente il numero dei valori generati, l'istogramma, sia che scelga 20, 10 o 2 classi, tende a stabilizzarsi su un istogramma con colonne di uguale altezza, come quello del "dado equo" (®p.12):  sotto sono riprodotti gli "istogrammi limite" corrispondenti a queste tre scelte dei sottointervalli.

          Possiamo, quindi, assumere che, suddividendo [0,1) in sottointervalli uguali, il valore che prende rnd abbia uguale probabilità di cadere nel 1° sottointervallo o nel 2° sottointervallo o in qualunque altro.

          Ad esempio nel caso della suddivisione in 10 classi la probabilità che rnd assuma un valore in [0,0.1) e quella che assuma  un valore in [0.3,0.4) è 1/10=0.1=10%.

  Qual è la probabilità che rnd assuma un valore compreso tra 0.5 e 1?

     Più in generale concludiamo che la probabilità che RND prenda un valore in un sottointervallo di [0,1) è proporzionale all'ampiezza di esso, cioè che è pari al rapporto tra l'ampiezza del sottointervallo e l'am-piezza dell'intero intervallo.  In formula, se [h,k) è un sottointervallo di [0,1):

Pr(rndÎ[h,k)) = =  =  ampiezza di [h,k)

  Qual è la probabilità che rnd assuma un valore compreso tra 1/3 e 2/3?

     L'istogramma relativo all'analisi statistica di un certo numero di valori assunti da una grandezza casuale viene chiamato anche istogramma di distribuzione sperimentale, per distinguerlo dall'istogramma in cui al posto delle frequenze relative si considerano le probabilità, che viene chiamato istogramma di distribuzione teorico.

     Analogamente si parla di media, mediana, moda, percentili, … sperimentali quando ci si riferisce alle frequenze percentuali ricavate da un'analisi di dati  e  di media, mediana, moda, percentili, … teorici quan-do si considerano al posto delle frequenze percentuali le corrispondenti probabilità.

  Indica un intervallo [a,b), il più piccolo possibile, in cui cadono le uscite del programma:

FOR I=1 TO 30 : PRINT RND*2 : NEXT

     Disegna a lato l'istogramma di distribuzione teorico di RND*2 riferito alla suddivisione di [a,b) in due sottointervalli uguali.

     Qual è la probabilità che RND*2 assuma un valore compreso tra 0 e 1?

     Se indico con la variabile casuale U il valore assunto da RND*k nel corso dell'esecuzione di un pro-gramma, per rappresentare il comportamento di RND*k devo:

   associare a U come insieme di possibili valori l'intervallo I=[0,k);

   considerare la misura di probabilità Pr così definita per ogni sottointervallo J di I:

Pr(UÎJ)=

     Più in breve, si dice che ho dotato U di una legge di distribuzione uniforme sull'intervallo I.

     Consideriamo un ago imperniato su un chiodo verticale. Diamo un colpo all'ago e vediamo qual è la direzione finale in cui si ferma.

     Suppongo, in base a considerazioni di tipo fisico (verticalità del chiodo, bilanciamento dell'ago, …) e a verifiche sperimentali, che non vi siano direzioni privilegiate, nel senso che, comunque prenda due direzioni, la direzione finale dell'ago possa con la stessa pro-babilità essere più vicina all'una o all'altra.

     Posso indicare la direzione finale dell'ago con la variabile casuale D. Associo a D [0,360) come intervallo di possibili valori e doto D di una legge di distribuzione uniforme.

  Sia Pr la misura di probabilità associata alla variabile casuale D dell'esempio ora descritto.

          Quanto vale Pr(0≤D<90)?        Quanto vale Pr(90≤D<270)?  Quanto vale Pr(60≤D<90)?

                                                                                                                                  

  Vogliamo simulare al calcolatore il "colpo all'ago" dell'esempio precedente con il programma seguente:

k=...

10

D=RND*k

PRINT "direzione =";D;"gradi"; TAB(35)

INPUT "'a capo' per un altro colpo, S per smettere", risp$

IF UCASE$(risp$)="S" THEN END

GOTO 10

          Completalo in modo opportuno, così da ottenere uscite come queste:

     Nel caso del lancio di un dado equo, se ne rappresento l'uscita con una variabile casuale U, devo:

   associare a U come insieme di valori possibili l'insieme finito {1,2,…,6};

   considerare la misura di probabilità Pr così definita per ogni h in  {1,2,…,6}:

                                                                                                                                      Pr(U=h) =

     Più in breve, si dice che ho dotato U di una legge di distribuzione uniforme sull'insieme {1,2,…,6}.

     Più in generale, se U è una variabile casuale a cui è associato come insieme di valori su cui può variare un insieme di n oggetti matematici {a1,a2,,an}, dotare U di una legge di distribuzione uniforme vuol dire considerare una misura di probabilità Pr che associ lo stesso valore di probabilità, 1/n, a tutti gli n eventi U=ai.

  Considera una moneta equa, cioè una moneta per cui si possa ritenere che, lanciandola, l'uscita di "testa" e quella di "croce" siano egualmente possibili. Utilizzando la variabile casuale M con valori possibili "T" e "C", modellizza questa situazione definendo opportunamente una misura di probabilità Pr.

  Considera il lancio di due dadi equi. Rappresentiamo le uscite dei due dadi con le variabili casuali U1 e U2 con distribuzione uniforme in {1,2,…,6}. Per rappresentare l'"uscita complessiva" consideriamo la variabile casuale U definita come U=U1+U2.  Qual è l'insieme di valori che può assumere U?  U ha distribuzione uniforme su tale insieme?   Perché?

     Se U è una variabile casuale a cui si è associato, come insieme di valori su cui può variare, un insieme di oggetti matematici {a1,a2,a3,…}, dotare U di una legge di distribuzione vuol dire descrivere come calcolare i valori di una misura di probabilità Pr per gli eventi  U=ai.

     Nel paragrafo 7 studieremo la legge di distribuzione della variabile casuale considerata nel quesito 37.

     Se invece a U è associato, come insieme di valori su cui può variare, un intervallo I di numeri, dotare U di una legge di distribuzione vuol dire descrivere come calcolare i valori di una misura di probabilità Pr per gli eventi del tipo UÎJ con J sottointervallo di I.

  Uno sportello di un ufficio pubblico ha come orario di apertura l'intervallo [8.5, 13] (dalle 8 e mezza all'una). Indichiamo con la variabile casuale T l'ora in cui arriva un utente. Ha senso, secondo te, rappresentare questa situazione dotando T di una legge di distribuzione uniforme?

  Il programma seguente simula il lancio di una moneta equa (®quesito 36), dando luogo a uscite come queste:

10

U=FIX(RND*2)                        ' FIX è il troncamento agli interi

IF U=0 THEN M$="T" ELSE M$="C"

PRINT M$;

INPUT  "       'a capo' per un altro lancio, S per smettere", risp$

IF UCASE$(risp$)="S" THEN END

GOTO 10

     Quali valori può assumere la variabile U?   Ha distribuzione uniforme?

     Per simulare il lancio di un dado equo, analogamente a quanto fatto nel programma del quesito precedente, posso utilizzare l'assegnazione:       U = FIX(RND*6)+1

     Vediamo perché.

   Rappresento con la variabile casuale X con distribuzione uniforme in [0,1) il comportamento di RND. Indico con Pr la corrispondente misura di probabilità.

     Definisco la variabile casuale U in funzione della variabile casuale X, mediante la relazione U=FIX(6)+1.

   La moltiplicazione per 6 trasforma X nella variabile casuale Y=X·6 a valori in [0,6); anche Y ha distribuzione uniforme (®quesito 33 e commenti seguenti).

   L'applicazione della funzione FIX dà luogo alla variabile casuale Z=FIX(Y) che ha distribuzione uni-forme in {0,1,2,3,4,5}:

Z=i (i intero tra 0 e 5) equivale a i≤Y<i+1 e Pr(i≤Y<i+1) =  = 1/6.

   Infine con l'incremento di 1 ottengo la variabile casuale U=Z+1 con distribuzione uniforme in {1,2,3,4,5,6}.

     La legge di distribuzione uniforme è solo un modello matematico del comportamento di rnd, non lo rappresenta esattamente:

   rnd non può assumere come valori tutti i numeri reali dell'intervallo [0,1) ma solo un sottoinsieme dell'insieme dei numeri macchina contenuti in tale intervallo, e questi sono in quantità finita in quanto sono descrivibili con sequenze di bit di lunghezza fissata [®I numeri, scheda 3];

   inoltre i valori che assume rnd, inevitabilmente (stiamo usando un computer), non si susseguono in modo "casuale", ma sono generati in un dato ordine (x1, x2, x3, …, xN) da un algoritmo che, dopo una quantità finita N di valori – vari milioni nel caso del QBasic –, ritorna a generare il valore iniziale x1 e poi x2, x3, … ; per questo motivo rnd (o, meglio, l'algoritmo che ne calcola i valori) viene chiamato anche generatore di numeri pseudocasuali;

   se rieseguiamo più volte il programma all'inizio di §6 o il programma del quesito 33 otteniamo sempre le stesse uscite: ogni volta che si avvia l'esecuzione di un programma l'algoritmo si predispone a generare la stessa sequenza x1, x2, x3, …, xN, x1, x2, … di numeri pseudocasuali.

     Per cambiare il numero pseudocasuale di partenza si può usare l'istruzione RANDOMIZE intero che, a seconda del numero intero impiegato, sceglie, con un particolare procedimento, il valore xi da cui avviare la generazione.

     Affinché il programma scelga "a caso" il valore di partenza, come argomento di randomize si può usare TIMER, cioè il numero dei secondi trascorsi dall'avvio del computer.

     Quindi, se nel programma all'inizio di §6 aggiungessi la riga RANDOMIZE TIMER, ad ogni esecuzione otterrei una sequenza di uscite diversa dalla precedente.

     Giocando a dadi con un "amico" mediante un programma di simulazione invece che con dadi veri,  usando randomize con ar-

gomenti diversi si possono costruire partite con "storie" che sono in grado di conoscere a priori.

     Nel programma fa_rnd.bas (®p.17), dalla riga [12] possiamo togliere l'apostrofo iniziale (in modo da attivare l'istruzione randomize timer) se non vogliamo ottenere sempre la stessa sequenza di dati.

  Secondo voi i seguenti programmi sono utilizzabili entrambi per simulare il lancio di due dadi equi? Perché?

10

X = RND

U1 = FIX(X*6)+1 : U2 = FIX(X*6)+1

U = U1+U2

PRINT U : GOTO 10

10

U1 = FIX(RND*6)+1 : U2 = FIX(RND*6)+1

U = U1+U2

PRINT U : GOTO 10

 

7. Modi per calcolare probabilità

     Voglio studiare come si distribuiscono le uscite del lancio di due dadi equi, cioè individuare la legge di distribuzione di U definita con U=U1+U2 dove U1eU2 hanno distribuzione uniforme in {1,2,…,6}.

     Per non procedere a mano, con due dadi veri, posso ricorrere al programma fa_rnd.bas mettendo nel sottoprogramma prova la 2ª e la 3ª riga del secondo programma del quesito 40. Generando 2000 uscite e analizzandole con statfile, ottengo:

    

Nota1.     statfile è un programma che consente di analizzare dati che rappresentino misure di grandezze, cioè dati espressi con numeri reali (o loro approssimazioni). Quando si deve tracciare l'istogramma, se i dati non sono già classificati e registrati sotto forma di intervalli e relative frequenze, statfile chiede di scegliere l'intervallo [a,b) e il numero dei suoi sottointervalli (di uguale ampiezza) in cui classificare i dati.

     Nel caso in cui si voglia utilizzare statfile per analizzare i dati relativi a un fenomeno descritto con una variabile casuale a valori interi, come nel caso in questione, occorre scegliere a e b interi e considerare una partizione in b–a sottointervalli, in modo da ottenere intervallini ampi 1:

Nel nostro caso abbiamo preso l'intervallo [2,13) e l'abbiamo suddiviso negli 11 intervallini [2,3), [3,4), …, [12,13): l'uscita 2 viene classificata in [2,3), l'uscita 3 in [3,4), …  In alternativa si poteva considerare l'intervallo [1.5,12.5) e suddividerlo in 11 intervallini: l'uscita 2 sarebbe stata classificata in [1.5,2.5), l'uscita 3 in [2.5,3.5), …, l'uscita n nell'intervallo ampio 1 e centrato in n [®Le statistiche, scheda 3, ques.31]

Nota2. Per analizzare dati relativi a una variabile casuale che può assumere una quantità finita (o nume-rabile) di valori di tipo non numerico, ad esempio le stringhe "1", "2", "X"  o  le stringhe "T", "C", si possono registrare i dati sostituendo a questi valori dei numeri interi, ad esempio usando 1, 2 e 3 al posto di "1", "2" e "X", usando 0 e 1 al posto di "T" e "C" (®messaggio iniziale del sottoprogramma di statfile per leggere/costruire file).

     Da questo istogramma sperimentale si deduce che 7 è l'uscita più frequente è la mediana. Anche la media è circa 7. L'istogramma è abbastanza simmetrico rispetto alla colonna che rappresenta l'uscita 7 e è di forma presso che triangolare.

     Vogliamo provare a individuare l'istogramma teorico attraverso ragionamenti, senza andare a effettuare ulteriori prove per vedere come si stabilizza l'istogramma sperimentale.

     Per fare ciò possiamo elencare tutte le possibili uscite della coppia (U1,U2):

 

 

U2=1

U2=2

U2=3

U2=4

U2=5

U2=6

 

U1=1

 2

 3

 4

 5

 6

 7

 

U1=2

 3

 4

 5

 6

 7

 8

 

U1=3

 4

 5

 6

 7

 8

 9

 

U1=4

 5

 6

 7

 8

 9

 10

 

U1=5

 6

 7

 8

 9

 10

 11

 

U1=6

 7

 8

 9

 10

 11

 12

 

 

         I 36 eventi U1=m and U2=n (al variare di m e n in {1,2,…,6}) sono tutti equiprobabili (in quanto i dadi sono equi) e, ovviamente, incom-patibili.

         Quindi, ciascun evento U1=m and U2=n ha probabilità 1/36.

  Calcoliamo le probabilità degli eventi U=U1+U2 =n.

 

U=2 equivale a  U1=1 and U2=1;                                                                      quindi ha probabilità 1/36

U=3 equivale a  (U1=1 and U2=2) or (U1=2 and U2=1);         quindi ha probabilità 1/36+1/36=2/36

U=4 equivale a  (U1=1 and U2=3) or (U1=2 and U2=2) or (U1=3 and U2=1);

                                                                                               quindi ha probabilità 1/36+1/36+1/36=3/36

U=5 equivale a  (U1=1 and U2=4) or ;                          quindi ha probabilità 1/36+…+1/36=4/36

U=6 equivale a  (U1=1 and U2=5) or ;                          quindi ha probabilità 1/36+…+1/36=5/36

U=7 equivale a  (U1=1 and U2=6) or ;                          quindi ha probabilità 1/36+…+1/36=6/36

U=8 equivale a  (U1=1 and U2=7) or ;                          quindi ha probabilità 1/36+…+1/36=5/36

   

U=12 equivale a  U1=6 and U2=6;                                                                    quindi ha probabilità 1/36

  Sotto è riprodotto parzialmente l'istogramma di distribuzione teorico della variabile casuale U considerata sopra. Completalo e scrivi la probabilità della moda, cioè dell'uscita più probabile.

          Calcola, nel modo più semplice possibile, Pr(2<U<12).

     Se non volessimo determinare la distribuzione teorica di U, ma solamente calcolare Pr(U=4), dove U è la variabile casuale U1+U2 dell'esempio precedente, potremmo procedere in vari modi.

     Sperimentalmente, con un programma simile al seguente:

RANDOMIZE TIMER

n=0 : ok=0

10

n=n+1

u=FIX(RND*6)+FIX(RND*6)+2

IF u=4 THEN ok=ok+1

IF n/1000=n\1000 THEN PRINT "n ="; n TAB(15) "freq.% ="; ok/n*100; "%"

' stampo la frequenza relativa ogni 1000 prove

GOTO 10

ottenendo uscite come queste:

                                     

                                     

     La frequenza relativa tende a stabilizzarsi attorno all'8%. Posso assumere questo valore come appros-simazione della probabilità cercata (come già osservato a p.13, vedrai nelle classi successive come valutare la precisione di questa approssimazione).

     Teoricamente possiamo procedere così:

   le coppie possibili (U1,U2) sono 6·6: 6 valori possibili di U1 e 6 valori possibili di U2;

   le coppie che danno luogo all'uscita 4 sono 3·1: 3 valori possibili di U1 (1,2,3) e, per ciascuno di questi, 1 solo valore possibile di U2 (se U1=1 allora U2 deve essere 3, se U1=2 allora U2 deve essere 2, …);

     

    6   6

     

    3   1

   poiché le coppie sono equiprobabili, ciascuna ha probabilità 1/36 e quindi l'uscita 4, che corrisponde a 3 coppie, ha probabilità 1/36+1/36+1/36 = 1/36 = 3/36 = 1/12

     In breve: le coppie possibili sono 36 e sono tutte equiprobabili, quelle favorevoli sono 3; quindi:

probabilità =

     In alternativa posso trovare Pr(U=4) usando un grafo ad albero (®Gli oggetti matematici):

  rappresento con successive diramazioni i diversi esiti possibili per U1 e per U2 (eventualmente raggruppando gli esiti "sfavorevoli" in un'unica diramazione);

  associo agli archi che corrispondono a esiti "favorevoli" la relativa probabilità;

  calcolo, per ogni percorso (dal nodo iniziale a un nodo finale) costituito solo da archi "favorevoli", il prodotto delle probabilità associate ai vari archi e lo scrivo a fianco del nodo finale;

  sommo i valori così calcolati.

I percorsi favorevoli sono:

U1=1, U2=3

U1=2, U2=2

U1=3, U2=1

             U1       U2

     Ad esempio il primo arco del primo percorso corrisponde a U1=1 che ha probabilità 1/6(circa 17%); il secondo arco corrisponde a U2=3 che ha probabilità 1/6(circa 17%).

     Il percorso complessivo ha come probabilità il prodotto delle due probabilità: il 17% del 17%.

     Dopo aver calcolato le probabilità dei percorsi favorevoli, abbiamo fatto la somma di queste probabilità. Nel far ciò abbiamo implicitamente usato la proprietà additiva: infatti ogni percorso è, evidentemente, incompatibile con gli altri.

  Supponiamo di disporre di due dadi, uno equo (con uscita U1), l'altro con uscita U2 avente la seguente legge di distribuzione:                   Pr(U2=1)=10%,     Pr(U2=2)=19%,              Pr(U2=3)=Pr(U2=4)=14%,

                                                   Pr(U2=5)=15%,        Pr(U2=6)=28%

     Per calcolare  Pr(U1+U2 =4)  puoi usare entrambi i metodi "teorici" visti sopra ("casi favorevoli"/"casi possibili"; grafo ad albero)?

     Calcola Pr(U1+U2 =4).

8. Eventi (probabilisticamente) dipendenti e indipendenti

     Usando il "metodo dei grafi", per motivare il prodotto delle probabilità associate agli archi di un percorso abbiamo fatto riferimento al prodotto di percentuali. Consideriamo un esempio per approfondire questo aspetto.

    Nella città XX il 21% degli abitanti sono biondi; il 52% degli abitanti sono femmine; il 9% degli abitanti sono abbonati "allo stadio", per una o l'altra delle due squadre cittadine. Posso stimare la percentuale di abitanti che sono femmine bionde?  Posso stimare la percentuale di abitanti che sono femmine abbonate?

 

     Affrontiamo la prima domanda.

     Suppongo, ragionevolmente, che l'essere biondo (B) e l'essere femmina (F) siano caratteristiche indi-pendenti, cioè che i biondi si distribuiscano tra i maschi allo stesso modo che tra le femmine: la percentuale di biondi tra i maschi e quella tra le femmine siano uguali a quella che c'è nel complesso degli abitanti.

     Quindi dalla tabella sottostante a sinistra, che rappresenta le informazioni iniziali, posso ottenere la tabella a destra riproducendo la riga in basso nelle righe soprastanti modificandola proporzionalmente mediante i fattori moltiplicativi 48% e 52%:

 

 

B

not B

tot

 

 

B

not B

tot

 

F

 

 

52%

 

F

2152%

7952%

52%

 

M

 

 

48%

®

M

2148%

7948%

48%

 

tot

21%

79%

100%

 

tot

21%

79%

100%

 

In formula, ho fatto:                  FrequenzaRelativa(B and F) = FrequenzaRelativa(BFrequenzaRelativa(F)

     Se indico con la variabile Sesso a valori in {"m", "f"} il sesso di un generico abitante di XX e con la variabile Biondo a valori in {"sì", "no"} il suo essere o no biondo, posso esprimere la supposizione fatta inizialmente dicendo che Sesso e Biondo sono variabili casuali "indipendenti".

     Passando dalla frequenza alla probabilità, possiamo scrivere:

Pr(Biondo="sì" and Sesso="f") = Pr(Biondo="sì"Pr(Sesso="f").

     Quindi se estraggo a caso dall'anagrafe di XX il nominativo di un abitante, la probabilità che sia una femmina bionda è:  Pr(Biondo="sì"Pr(Sesso="f") = 2152% = 11%  (ho arrotondato a 2 cifre il risultato 0.1092 di 0.20.52 in quanto i fattori erano arrotondati a 2 cifre: ®calcolo approssimato in Gli oggetti matematici).

  Si può procedere allo stesso modo (529%=…) per valutare la probabilità che il nominativo estratto sia di una abbonata allo stadio?

  Provate a rispondere alle seguenti domande:

          Qual è la probabilità che alzando 2 volte un mazzo (nuovo) di carte da scopa ottenga sempre una carta di denari?

          Qual è la probabilità che estraendo 2 carte dal mazzo queste siano entrambe di denari?

     Mentre è ragionevole supporre che l'essere biondo e l'essere femmina siano caratteristiche indipendenti (ciò, in effetti, è confermato dalle statistiche: le percentuali di biondi tra i maschi e tra le femmine sono presso che identiche), sicuramente vi sono più abbonati tra i maschi che tra le femmine.

     Quindi è sbagliato rispondere al quesito 43 ritenendo applicabile la formula:

     Pr(Abbonato="sì" and Sesso="f") = Pr(Abbonato="sì"Pr(Sesso="f")

     Senza altre informazioni non si può valutare la probabilità di estrarre il nominativo di una femmina abbonata.

     Vedremo ora che le situazioni del quesito 44 presentano analogie con le situazioni appena discusse.

     Nel caso della alzata, avendo supposto il mazzo nuovo (e non truccato e mescolato bene) posso ritenere che, tagliandolo, le carte compaiano con distri-buzione uniforme, cioè tutte con la stessa probabilità. Quindi posso applicare la formula:    probabilità = "n° casi favorevoli"/"n° casi possibili".

     I casi possibili sono 40·40: 40 carte possibili per la prima alzata e 40 per la seconda.

     I casi favorevoli sono 10·10: sono 10 le carte di denari.

     La probabilità che esca una carta di denari entrambe le volte è:

 = = 6.25%

 

     Posso anche considerare direttamente la grandezza casuale "seme", a valori in {©, ¨, §, ª}, che, per gli stessi motivi di prima, posso ritenere con distribuzione uniforme: l'uscita di una carta di denari ha la stessa probabilità di quella di una carta di fiori o di quella di una carta di cuori o …        Quindi posso usare:   probabilità = "n° casi favorevoli"/"n° casi possibili".

     I casi possibili sono 4·4 (4 semi possibili), quelli favorevoli 1·1 (1 è il seme  che mi interessa).                    La probabilità cercata dunque è:

        

 = = 6.25%

 

     Avremmo anche potuto utilizzare un grafo ad albero:

     Nel caso dell'estrazione posso sempre ritenere equiprobabili le carte del mazzo.

     I casi possibili sono 40·39 (alla 2ª estrazione dispongo di una carta in meno).

     I casi favorevoli sono 10·9 (se nella 1ª estrazione è uscito denari nel mazzo sono rimaste 9 carte di denari).

 

     La probabilità cercata è:    = = 5.8% (arrotondamento)

     Anche in questo caso avremmo potuto ricorrere ad un grafo ad albero.

 

     Indichiamo con la variabile casuale S1 il seme della prima uscita (alzata o estrazione) e con la variabile casuale S2 quello della seconda uscita.

     Nel caso della alzata le variabili casuali S1 e S2 sono indipendenti: qualunque seme abbia la 1ª carta, la probabilità che la 2ª abbia un certo seme è sempre la stessa.

     Ciò corrisponde al fatto che il grafo relativo all'alzata si riproduce allo stesso modo passando da una diramazione alla successiva.

     Per calcolare Pr(S1=¨ and S2=¨) posso fare direttamente Pr(S1=¨Pr(S2=¨) = 1/1/4 = 1/16

     Nel caso della estrazione le variabili casuali S1 e S2 non sono indipendenti: ad esempio Pr(S2=¨) (la probabilità che la 2ª carta sia di ¨) dipende dal valore assunto da S1 (cioè dal seme della 1ª carta).

     Ciò corrisponde al fatto che il grafo relativo alla estrazione non si riproduce allo stesso modo passando da una diramazione alla successiva: al primo arco "¨" è associata la probabilità 1/4, al secondo arco "¨" è associata la probabilità 9/39.

  A lato sono riportati in forma più estesa i grafi ad albero relativi all'alzata e all'estrazione di due carte da un mazzo. Utilizzandoli calcola, sia per l'alzata che per l'estrazione, la probabilità che esca una sola volta denari, cioè:

Pr(S1=¨ and not S2=¨) or Pr(not S1=¨ and S2=¨)

  Provate a rispondere alle seguenti domande:

          Qual è la probabilità che alzando 2 volte un mazzo (nuovo) di carte da scopa ottenga sempre lo stesso colore?

          Qual è la probabilità che estraendo 2 carte dal mazzo queste abbiano lo stesso colore?

     Riassumendo, due eventi vengono ritenuti indipendenti se l'ipotesi che uno si verifichi non modifica la valutazione che l'altro possa verificarsi:

   sapere che una persona è bionda non modifica la mia valutazione della probabilità che essa sia una femmina: "essere biondo" e "essere femmina" sono eventi indipendenti.

   sapere che alla prima alzata è uscito denari non modifica le mie aspettative sull'uscita di denari alla seconda alzata: "uscire denari alla 1ª alzata" e "uscire denari alla 2ª alzata" sono eventi indipendenti.

     In questi casi come probabilità che si verifichino entrambi gli eventi assumo il prodotto delle probabilità dei due singoli eventi.

     In generale, due eventi A e B vengono detti indipendenti se:      Pr(A and B) = Pr(APr(B)                                                                                                                                               (#)

     Nel primo esempio l'indipendenza di "essere biondo" e "essere femmina" è dedotta dalle statistiche (si verifica che la percentuale di biondi tra le femmine è quasi uguale a quella tra il totale degli abitanti).

     Nel secondo esempio l'indipendenza di "uscire denari alla 1ª alzata" e "uscire denari alla 2ª alzata" è assunta a priori, ritenendo il mazzo non truccato e in buono stato. Ma, ad essere rigorosi, occorrerebbe una verifica sperimentale per aumentare la fiducia verso tale supposizione.

     Se, invece, l'ipotesi che un evento si verifichi modifica la valutazione che l'altro possa verificarsi (cioè se i due eventi non sono indipendenti) diciamo che gli eventi sono dipendenti:

   sapere che una persona è abbonata allo stadio modifica la mia valutazione della probabilità che essa sia una femmina (lo ritengo meno probabile): "essere abbonato" e "essere femmina" sono eventi dipendenti.

   sapere che alla prima estrazione è uscito denari modifica le mie aspettative sull'uscita di denari alla seconda estrazione (le mie aspettative si riducono): "uscire denari alla 1ª estrazione" e "uscire denari alla 2ª estrazione" sono eventi dipendenti.

     Due variabili casuali X e Y sono indipendenti se sono indipendenti gli eventi A e B comunque prenda A evento in cui compare solo X e B evento in cui compare solo Y.

     Altrimenti X e Y vengono dette dipendenti.

     Sono indipendenti le variabili casuali Biondo e Sesso del primo esempio.

     Lo sono pure le variabili S1 e S2 nel caso della alzata: ad esempio sono indipendenti l'evento S1=¨ e l'evento S2=§,  sono indipendenti l'evento che esca colore rosso alla 1ª alzata (cioè: S1Î{¨, ©}) e quello che esca rosso alla 2ª alzata (cioè: S2Î{¨, ©}), …

Nota. Il concetto di dipendenza ora introdotto è diverso da quello impiegato per esprimere il legame tra due grandezze quando una varia in funzione dell'altra.

     Se A e L sono area e lato di un generico quadrato, A dipende da L nel senso che ad ogni valore di L corrisponde un unico valore di A.

     Invece nel caso dell'estrazione dire che le variabili S1 e S2 sono dipendenti non significa che l'una è funzione dell'altra: l'uscita di ¨ alla 1ª estrazione non determina univocamente l'uscita della 2ª estrazione. Quando è il caso, per distinguere i due tipi di dipendenza, si parla, rispettivamente, di dipendenza funzionale (o deterministica) e di dipendenza probabilistica.

     Supponiamo di voler trovare la probabilità di estrarre una femmina dall'elenco degli abitanti che sono abbonati, valore che indichiamo con l'espressione:  Pr(Sesso="f"|Abbonato="sì")  (leggendo: «proba-bilità dell'evento Sesso="f" nella condizione che si verifichi l'evento Abbonato="sì").

     La popolazione a cui riferire l'essere femmina non è il totale degli abitanti, ma solo il sottoinsieme degli abbonati.

     La probabilità cercata è dunque uguale a: 

     Analogamente, nel caso della estrazione, indi-chiamo con Pr(S2=¨|S1=¨) la probabilità che alla 2ª estrazione esca ¨ nella condizione che sia uscito ¨ alla 1ª estrazione.

     A p.26 per calcolare Pr(S2=¨ and S1=¨) ab-biamo fatto:

Pr(S2=¨ and S1=¨) =

Pr(S1=¨) · Pr(S2=¨|S1=¨)

                                        = ·

     Il concetto di probabilità condizionata introdotto in questi due esempi può essere generalizzato.

     Dati due eventi A e B indichiamo Pr(A|B) (pro-babilità che si verifichi A a condizione che si verifichi B, o, più in breve, probabilità di "A condizionato a B") il rapporto definito nel modo a fianco:

Pr(A|B) = 

     Nel secondo esempio (estrazione) abbiamo utilizzato la formula equivalente:

                                                        Pr(B and A) = Pr(BPr(A|B)                              (##)

     Tutte le volte che abbiamo calcolato delle probabilità con il "metodo dei grafi", abbiamo, di fatto, applicato questa formula.

     Nel caso in cui A e B sono indipendenti, ovviamente Pr(A|B)=Pr(A) (il verificarsi o meno di B non condiziona la valutazione di Pr(A)). In questo caso la formula (##) diventa la formula (#) di p.27.

  Utilizzando la tabella a lato, valutate se sesso e settore di attività (classificato in "agricoltura", "industria", "altre atti-vità") in cui una persona (nel 1991) era occupata possono essere ritenute (probabilisticamente) indipendenti e, in caso negativo, se, almeno, l'occupazione in agricoltura o l'occu-pazione nell'industria o quella in "altre attività" è indipendente dal sesso.

settore                  M              F

agricoltura         1.17          0.66

industria            5.26          1.66

altre attiv.           7.68          5.18

totale                14.10         7.49

(1991; dati in milioni)

  In una fabbrica una particolare lavorazione viene eseguita utilizzando due macchine uguali, che vengono azionate alternatamente. Dopo il primo turno (prime 4 ore) vengono controllate le macchine. Se una macchina ha dei difetti di funzionamento viene fermata per essere sottoposta a interventi di riparazione alla fine della giornata e essere rimessa in funzione il giorno seguente.

          Utilizzando le seguenti informazioni:

   quando la lavorazione viene eseguita su entrambe le macchine, ciascuna ha probabilità di presentare alla fine del turno difetti di funzionamento del 7%,

   quando la lavorazione viene eseguita su una sola macchina, la probabilità che alla fine del turno essa presenti difetti di funzionamento è del 10%,

calcola (utilizzando un grafo):

   la probabilità che alla fine della giornata (cioè dopo 2 turni) entrambe le macchine debbano essere riparate,

   la probabilità che almeno 1 delle macchine debba essere riparata,

   la probabilità che non ci sia bisogno di riparazione.

 

Nota. Abbiamo simulato l'esito del lancio di due dadi (®p.21) con:

U1=FIX(RND*6)+1 : U2=FIX(RND*6)+1 : U=U1+U2

        Affinché la simulazione sia corretta non basta che RND abbia distribuzione uniforme: l'uscita di un dado deve essere indipendente da quella dell'altro, cioè U1 e U2 devono comportarsi come variabili casuali indipendenti.

     Ciò si verifica anche se abbiamo usato lo stesso generatore di numeri pseudocasuali per ottenere sia U1 che U2? In altre parole, è corretto considerare le due comparse di RND come due distinte variabili casuali?

     In effetti si può verificare sperimentalmente al calcolatore che, comunque prenda m e n in {1,2,…,6}:

FrequenzaRelativa(U1=m and U2= n)@FrequenzaRelativa(U1=mFrequenzaRelativa(U2=n)

     Ciò accade non solo per assegnazioni del tipo U1=FIX(RND*6)+1, ma anche per altre assegnazioni in cui compare RND (quindi si può usare RND non solo per simulare il lancio di dadi, ma anche lanci di monete, colpi ad aghi, …).

9. Usi (e limiti) del calcolo delle probabilità

     Consideriamo qualche esempio d'uso significativo del calcolo delle probabilità in contesti "seri".

   Per svolgere alcuni mestieri, molto diffusi, occorre affrontare un test sanitario che accerti l'eventuale presenza (esito positivo) o l'assenza (esito negativo) della malattia X. Il test ha un'attendibilità del 95% (nel senso che in caso di presenza c'è il 95% di probabilità che si ottenga un esito positivo e in caso di assenza c'è il 95% di probabilità che si ottenga un esito negativo). Si sa, da statistiche serie, che l'1% della popolazione in età lavorativa è affetta da tale malattia.

     Se per una persona il test dà esito positivo, qual è la probabilità che essa sia affetta dalla malattia X?

     Si deve determinare Pr("essere malato"|"risultare positivo"), cioè la probabilità che, essendo positivi, si sia anche malati.

Come abbiamo già visto, ciò significa determinare:

     Per calcolare questo rapporto dobbiamo trovare il valore dei "?" della tabella seguente. Per completare la tabella mettiamo i dati sulla popolazione (prime due colonne dell'ultima riga), poi utilizziamo il dato sull'attendibilità del test (per ottenere le prime due colonne della prima riga: 1·95%=0.95, 99·5%=4.95), infine elaboriamo la tabella (ci basta completare la prima riga: 0.95+4.95=5.90).

 

 

malati

sani

totale

 

malati

sani

totale

 

malati

sani

totale

positivi

?

 

?

 

0.95

4.95

?

 

0.95

4.95

5.90

negativi

 

 

 

®

 

 

 

®

 

 

 

totale

1

99

100

 

1

99

100

 

1

99

100

 

     La probabilità cercata è dunque 0.95%/5.90% = 16%, cioè molto meno del 95%, come in prima battuta qualcuno potrebbe rispondere.

     Volendo, per calcolare Pr("essere positivo") si poteva utilizzare il grafo ad albero a fianco.

  Una vetrina di un negozio viene infranta e viene prelevata parte della merce esposta. Un testimone afferma che il ladro era arabo. Quando gli inquirenti gli ripropongono scene simili in analoghe condizioni di luce, distanza, … il testimone identifica correttamente la razza (arabo, non arabo) del ladro nel 75% dei casi. È attendibile la testimonianza se nella località considerata il 12% dei furti sono opera di ladri di razza araba?   [per rispondere calcola la probabilità che il ladro sia effettivamente un arabo]

     Il calcolo delle probabilità (cioè, sostanzialmente, l'uso delle formule che sintetizzano le proprietà delle misure di probabilità) permette di razionalizzare le situazioni "incerte" in modo da rendere le scelte più consapevoli, ma, come già osservato (®nota a p.10), non è sufficiente a stabilire qual è la scelta più "conveniente": nella decisione possono intervenire altri ragionamenti.

  X, noto professionista, arriva alla stazione per prendere il treno per un importante viaggio di lavoro quando si accorge di aver dimenticato la carta di credito e di aver nel portafoglio solo 50 mila lire, insufficienti per il biglietto: mancano 30 mila lire. Allora X decide di scommettere 50 mila lire (con un'altra persona) che giocando a bim-bum-bam esca un numero multiplo di 3. Secondo voi la decisione di X è conveniente?

     In tutte le lotterie si è sempre di fronte a situazioni simili a quella del quesito precedente: dal punto di vista probabilistico giocare è sempre sconveniente:

solo una parte dell'incasso derivante dalla vendita dei biglietti viene utilizzata per pagare le vincite, per cui la vincita media è inferiore al prezzo del biglietto

ma nella decisione di acquistare un biglietto la valutazione probabilistica può essere controbilanciata da altre valutazioni di tipo economico, di tipo edonistico, …

     Per un altro esempio si pensi ai vaccini contro le malattie. Molti di essi hanno una certa probabilità di causare l'insorgere della malattia. Nella valutazione se è il caso di rendere obbligatoria la vaccinazione occorre tener conto sia di questa probabilità che della diffusione della malattia.

     Ad esempio se la malattia ha al momento una diffusione del 20%, se il vaccino ha il 4% di probabilità di provocare l'insorgere della malattia, il 90% di rendere immuni e il 6% di non avere effetti, possiamo ritenere statisticamente conveniente imporre la vaccinazione (a regime, si passerebbe dal 20% di malati al 4%+6%·20%=5.2%).

     Ma imporre a persone, che potrebbero comunque rimanere sane, una vaccinazione che può causare una malattia comporta valutazioni anche di tipo morale.

     Abbiamo visto che in molte situazioni il ricorso al calcolo delle probabilità non è risolutivo. Vi sono anche molti casi in cui si ricorre a valutazioni probabilistiche erroneamente o a sproposito per giustificare scelte o conclusioni.

     Ad esempio è molto frequente la realizzazione di indagini statistiche sui comportamenti, le opinioni, … della popolazione utilizzando campionamenti (®Gli oggetti matematici) mal fatti. I sondaggi telefonici effettuati nel corso di trasmissioni televisive quasi sempre presentano grossolani errori.

Gli "esperti" della trasmissione televisiva "Come la pensano gli italiani" effettua un sondaggio telefo-nico tra gli abitanti della città X sulle future elezioni del sindaco, carica a cui sono candidati i politici A e B.

         Mediante il programma:

10 PRINT "pagina dell'elenco:"; FIX(RND*563), "posto:"; FIX(RND*360) : GOTO 10

scelgono dall'elenco telefonico (costituito da 563 pagine, ciascuna con 360 nominativi) i nominativi delle persone da chiamare. Su 730 persone che rispondono al telefono, 243 dichiarano di preferire il candidato A, 226 dichiarano di preferire il candidato B, gli altri sono incerti o preferiscono non rispondere. Nella trasmissione viene detto che dal sondaggio effettuato risulta che il 52% degli abitanti voterà il candidato A. Secondo te, come si è arrivati a questa conclusione? È corretta?

     Un altro errore frequente è confondere la presenza di una relazione di dipendenza probabilistica con la presenza di un legame di causa-effetto.

Un gruppo di medici, utilizzando indagini statistiche, ha concluso che la malattia X (che fino ad allora si riteneva fosse causata dal tipo di alimentazione) è essenzialmente dovuta a fattori genetici.

         Infatti dalle statistiche ha dedotto che:

Pr("avere X"|"avere genitori o fratelli con X")>Pr("avere X"|not "avere genitori o fratelli con X")

     Vi sembra corretta questa conclusione? Perché?

10. Esercizi

Completa la seguente dimostrazione che la divisibilità per 3 di un numero intero equivale alla divisibilità per 3 della somma delle sue cifre, svolta, per semplicità, solo per il caso particolare in cui il numero abbia 4 cifre.

(1)   Sia N il numero considerato. Siano A, B, C e D le sue cifre (da sinistra verso destra), cioè sia N=A·1000+B·100+C·10+D;

(2)   Abbiamo:  N–(A+B+C+D) = A·1000+B·100+C·10+D–(A+B+C+D) = A·999+

       che è un numero divisibile per 3

(3)   Se P–Q è divisibile per 3, P e Q devono essere o entrambi divisibili per 3 o nessuno dei due divisibile per 3. Infatti:

     se Q fosse divisibile per 3, anche P, poiché sarebbe la somma di due numeri divisibili per 3 (infatti P=(P–Q)+Q), sarebbe divisibile per 3;

     se P fosse divisibile per 3 …

In vari libri medioevali si trovano "problemi del travaso" simili al seguente: «Un oste dispone solo di due mestoli "misuratori", uno da 1/4 di litro, l'altro da 1/5 di litro. Può, mediante uno o più travasi eseguiti mediante i mestoli, trasferire 3/10 di litro dalla botte in un altro recipiente?»

 

     Ai nostri giorni affrontiamo il problema così:

   indichiamo con M e N la quantità di travasi eseguiti, rispettivamente, con il 1° e con il 2° mestolo, conteggiando positivamente i travasi dalla botte al recipiente e negativamente quelli in senso opposto (ad esempio M=3 e N=–2 corrisponde a versare 3 mestoli da 1/4 nel recipiente e togliervi 2 mestoli da 1/5);

   il quesito si traduce nella questione se l'equazione 1/4·M+1/N=3/10 ha soluzioni, cioè se esistono coppie (M,N) di numeri interi che rendono vera l'equazione.

     Il problema ha soluzioni? [per rispondere trasforma l'equazione in un'altra più "comoda" da esaminare]

     In caso negativo motiva la risposta, in caso affermativo esplicita una soluzione e stabilisci se ce ne sono altre.

 

Luigi per conosce l'altezza di un muro procede così:

       pone uno specchio per terra tra sé e il muro e arretra fino a che vede riflesso nello specchio la sommità del muro;

       sa che i propri occhi sono all'altezza di circa 170 cm da terra, che lo specchio è a circa 120 cm dal muro e che lui dista dallo specchio circa 70 cm;

       utilizzando queste informazioni riesce a stimare l'altezza del muro.

         Come ha fatto? Quanto è alto il muro?

Per definire il fattoriale senza ricorrere ai puntini "…", a p.17 di Modelli matematici per l'economia abbiamo fatto ricorso a un programma. In alternativa possiamo utilizzare una definizione ricorsiva. Come?

Considera le successioni così definite:

              x(0)=A,  x(n+1)=                   y(0)=A,  y(n+1)=

     Utilizzando la CT, calcola un po' di elementi delle successioni che si ottengono assegnando ad A i valori seguenti: 4, 2, 100, 0.25. Che cosa puoi congetturare dalle uscite che ottieni?

Tra le seguenti definizioni di una successione x(.), ve ne sono di equivalenti?

 

x(0)=1, x(n+1)=x(n)+10%x(n)

x(0)=1, x(n+1)=x(n)/10

x(0)=1, x(n+1)=x(n)+x(n)

x(n)=1.1n

x(n)=2n

x(n)=10n

x(0)=1, x(n+1)=x(n1.1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  Per realizzare con il Lego una scaletta alta 5 mattoncini nel modo raffigurato a la-to devo impiegare 5+4+3+2+1=15 mattoncini. Indichiamo con M(n) il numero dei mattoncini necessari per realizzare una scaletta alta n (quindi M(5)=15).

     Calcola M(n) per diversi valori di n.

     Poi prova a definire M(n) ricorsivamente e, se ci riesci, mediante un'unica formula M(n)=… (per quest'ultima richiesta puoi aiutarti mettendo in relazione la quantità dei mattoncini della scaletta con la quantità dei rettangolini tratteggiati nel disegno).

 

La successione così definita:

         Q(0)=1, Q(1)=1, Q(N+2)=Q(N)+Q(N+1)

     illustrata nella figura a fianco è nota come succes-sione di Fibonacci è stata presentata nel "Liber abaci" da Leonardo Pisano (vissuto a cavallo del 1200 e noto come Fibonacci) come modello mate-matico del seguente "problema dei conigli": 

«quante coppie di conigli verranno prodotte in N mesi a partire da un'unica coppia se ogni mese ogni coppia dà alla luce una nuova coppia che diventa produttiva a partire dal secondo mese di vita?». 

    Q(N) rappresenta la quantità di coppie presenti dopo N mesi.

    Completa l'elenco dei termini della successione fino a Q(10).

    Scrivi un programma che dando N in input fornisca come output Q(N).

3 ragazze e 2 ragazzi si siedono al cinema in 5 posti consecutivi della stessa fila.               

In quanti modi possono occupare i posti, tenendo conto che ogni femmina vuole avere a fianco almeno un maschio (e viceversa)?

Disponendo di stoffe di 8 differenti colori quante bandiere tricolori a bande verticali (di dimensioni uguali e colori tutti diversi) puoi realizzare?

Un ristorante propone un menu turistico a prezzo fisso composto da un primo, a scelta tra 3, un secondo a scelta tra 4, due "varie" (bevande o dolce) a scelta tra 5. Quanti pasti diversi si possono scegliere?

Proviamo che (come annunciato a p.8) con la costruzione del triangolo di Tartaglia si può calcolare C(n,k):

  Il triangolo è costruito mettendo degli "1" sui lati obliqui; gli elementi su tali lati corrispondono ai valori di C(n,0) e di C(n,n). Dimostra, utilizzando la definizione del concetto di combinazione («sottoinsieme di k …»), che effettivamente C(n,0)=1 e C(n,n)=1.

  La costruzione degli elementi interni del triangolo corrisponde alla equaz. C(n+1,k+1)= C(n,k)+ C(n,k+1). Dimostra tale eguaglianza usando l'espressione per calcolare le combinazioni introdotta a p.7.

Sapendo che Pr(H<183)=87% e che Pr(H<170)=25% (situazione B a p.9), calcola Pr(170≤H<183).

Considera il dado non equo del quesito 42. Sia U la sua uscita. Calcola nel modo più semplice Pr(UÎ{1,3,4,5,6}). Calcola Pr("U è pari" or "U è un multiplo di 3").

Faccio il seguente esperimento: lancio una moneta ripetutamente fino a che esce testa e annoto la quantità N di lanci che ho effettuato. Quali sono i valori che può assumere la variabile casuale N? Calcola Pr(N>1).

Al gioco del Lotto sono 6 mesi che non esce 67 sulla ruota di Genova mentre 67 è uscito ieri sulla ruota di Napoli. Voglio giocare il 67 su una delle due ruote. Quale mi conviene scegliere?

 Lancio tre volte un dado equo. Qual è la probabilità di ottenere sempre la stessa faccia? Qual è la probabilità di ottenere almeno due volte la stessa faccia?

 Il 20% dei clienti dell'agenzia turistica Viaggi nell'anno X ha trascorso le vacanze all'estero. Di questi il 27% si è recato in Francia e il 33% in Spagna. Nell'anno X+1 la agenzia vuole valutare, ipotizzando che queste percentuali si mantengano, la probabilità che un cliente si rechi in vanaza in Francia. Calcola questa probabilità. In base a queste informazione sei in grado di calcolare la probabilità che un cliente non si rechi né in Francia né in Spagna?

Spesso si ritengono "strani" (e si attribuiscono a magie, miracoli, presenze extraterrestri, …) fenomeni che sono solo poco probabili o, a volte, non sono neanche poco probabili.  Illustriamo ciò con un esempio:

«Qual è la probabilità che in una classe di 25 alunni almeno 2 siano nati nello stesso giorno dell'anno?»

Rispondi (supponi per semplificare i calcoli che non ci siano alunni nati in anni bisestili) usando la traccia:

  la probabilità che gli alunni siano nati in giorni tutti diversi è Q=364/36·341/365=43%, infatti:

Sia Gn il giorno di nascita dell'alunno n-esimo nel registro di classe.

La probabilità che G2 sia diverso da G1 è 364/365 (364 possibilità su 365).

La probabilità che G3 sia diverso da G1 e da G2 è 363/365 e quella che, inoltre, G2 sia diverso da G1 è (364/365)·(363/365)=364/365·363/365

La probabilità che G25 sia diverso da G1, G2, … e G24 è 341/365 e quella che tutti i Gn (n=1,…,25) siano diversi tra loro è 364/36·341/365

  deduci da ciò la probabilità richiesta dal quesito.

Una commissione comunale è costituita da 8 persone, 4 della maggioranza e 4 della minoranza. Il presi-dente della commissione (appartenente alla maggioranza) estrae a caso (usando dei bigliettini) i 3 membri che dovranno far parte di una commissione di concorso. I tre sorteggiati appartengono tutti alla maggio-ranza. I membri della minoranza sospettano un broglio. Tu cosa ne pensi? (Calcola la probabilità che un sorteggio non truccato dia un esito di questo tipo).

Una quantità Q, inizialmente pari al valore H, che decresca seguendo una relazione del tipo Q=H·(1/2)n, dove n è il tempo trascorso espresso in una opportuna unità di misura T, è detta a decrescita esponenziale [®p.5]. Per n=1, cioè trascorso un intervallo di tempo T, Q si dimezza; per questo T è detto emivita (dal greco emi ="mezzo"). Una sostanza di un particolare farmaco è eliminata dall'organismo riducendosi se-condo una legge di questo genere con emivita di 30 ore. Dopo quanto tempo la sostanza all'interno dell'or-ganismo si riduce a 1/4? Dopo quanto a 1/16?

La successione di Fibonacci (Q(0)=Q(1)=1, Q(n+2)=Q(n+1)+Q(n) ®ques.60) coincide con la successione F(0), F(1), … dove:

F(n) =

     Verifica tale coincidenza per alcuni valori di n con Derive o con Grafun. Per avere la certezza della equivalenza tra F(n) e Q(n) verifica che F(0)=F(1)=1, F(n+2)=F(n+1)+F(n), "a mano" e con Derive.

Tra il software MaCoSa, nel directory STA, trovi il programma sperim.bas che generalizza il programma considerato a p.23. Esso contiene il sottoprogramma prova(v) in cui puoi simulare l'evento di cui vuoi valutare la probabilità e assegnare alla variabile V il valore 1 se l'evento si verifica, il valore 0 altrimenti. Ad es., per simulare l'uscita di due denari alzando due volte un mazzo da 40 (ques. 44) posso codificare con 0, 1, 2 e 3 i semi, e con 0 denari, e rappresentare l'evento con questo sottoprogramma:

seme1 = FIX(RND*4): valore1 = FIX(RND*10)+1

seme2 = FIX(RND*4): valore2 = FIX(RND*10)+1

IF seme1 = 0 AND seme2 = 0 THEN V = 1 ELSE V = 0

  Evidentemente valore1 e valore2 non entrano in gioco: il test (IF …) è fatto su seme1 e seme2; del resto mi interessa solo il seme, non il valore delle carte. Quindi posso usare più smplicemente:

seme1 = FIX(RND*4): seme2 = FIX(RND*4)

IF seme1 = 0 AND seme2 = 0 THEN V = 1 ELSE V = 0

    Utilizza il programma per studiare questo evento e confronta il risultato sperimentale con quello teorico.

Per studiare con sperim.bas (vedi ques. 75) il caso della doppia estrazione (vedi ques. 44) occorre tener conto della prima carta estratta. Si potrebbe procedere così:

seme1 = FIX(RND*4): valore1 = FIX(RND*10)+1

seme2 = FIX(RND*4): valore2 = FIX(RND*10)+1

WHILE seme1 = seme2 AND valore1 = valore2

  seme2 = FIX(RND*4): valore2 = FIX(RND*10)+1

WEND

IF seme1 = 0 AND seme2 = 0 THEN V = 1 ELSE V = 0

    Motiva questa scelta, studia sperimentalmente il caso della doppia estrazione e confronta il risultato che ottieni con quello teorico.

    Modifica il sottoprogramma usando l'istruzione LOOP (vedi l'Help), che consente una stesura più breve, anche se equivalente dal punto di vista del tempo di calcolo.

Provate (non è facilissimo) a studiare sperimentalmente e teoricamente la probabilità di avere poker (4 carte dello stesso valore tra le 5 che si sono ricevute) all'inizio di una mano di poker, giocata con 32 carte.

     [suggerimento per lo studio sperimentale: per far sì che nella simulazione le 5 carte ricevute siano tra loro diverse, nel sottoprogramma prova - vedi ques. 75 - dichiarare con DIM carta(3,8) una variabile carta a 2 indici, con l'idea di porre carta(i,j)=1 se esce la carta di seme i e valore j, e, man mano che si estraggono le 5 carte, se viene gererata la carta di seme i e valore j, controllare se carta(i,j) è già 1 e, in tal caso, rigenerare la carta; alla fine del sottoprogramma porre ERASE carta).

1)   Segna con l'evidenziatore, nelle pagine indicate, frasi e/o formule che descrivono il significato dei termini:

   successione, p.5    funz. esponenziale, p.5      disposizioni, combinazioni, p.6, 7  proprietà additiva, p.14

   fenomeno casuale, deterministico, p.15    evento,variabile casuale, p.16     istogr. di distribuzione,p.19

   legge di distribuz., p.19,20     eventi e variabili casuali (in)dipendenti , p.27    prob. condizionata , p.28

2)    Su un foglio da "quadernone" (che poi inserirai dopo l'ultima pagina della scheda), nella prima facciata, esemplifica l'uso di ciascuno dei concetti sopra elencati mediante una frase in cui esso venga impiegato.

3)    Nella seconda facciata riassumi in modo discorsivo (senza formule, come in una descrizione "al telefo-no") il contenuto della scheda (non fare un elenco di argomenti, ma cerca di far capire il "filo del discorso").