>>>>>

Scheda 6 - Problemi tipici della statistica matematica

6. CURVE APPROSSIMANTI. Interpolazione, approssimazione, scale semi- e bi-logaritmiche, quadratiche, ... . DIFFERENZE SUCCESSIVE, MEDIE MOBILI, metodo dei RAPPORTI.

    Come avremmo potuto congetturare, senza riflessioni particolari sullo specifico fenomeno, che l'istogramma di t-zombie ha andamento esponenziale? Più in generale, come si può cercare di approssimare un grafico sperimentale con una curva "bella" (cioè che si può descrivere facilmente mediante funzioni elementari)?

    Innanzi tutto facciamo qualche chiarimento terminologico, a partire da un esempio.

    Supponiamo di avere le 5 informazioni rappresentate sotto nella figura A relativamente a come un fenomeno y varia in funzione del fenomeno x.  Per stimare i valori assunti da y per i valori di x intermedi possiamo approssimare l'intero fenomeno congiungendo i punti con segmenti (figura B). Questa tecnica si chiama interpolazione lineare: si ottiene una funzione (continua lineare a tratti) che nei 5 punti noti coincide con la nostra y in funzione di x; la possiamo usare per approssimare y per gli altri valori di x.  Volendo ottenere una curva "totalmente liscia" (continua con tutte le sue derivate) potremmo individuare la funzione polinomiale di grado minimo che passa per tutti i 5 punti (figura C); ma questa interpolazione polinomiale in genere dà luogo a cattive approssimazioni.  Un'ulteriore possibilità è approssimare l'andamento tra i vari dati rilevati con diverse funzioni polinomiali tali da garantire che la curva risultante sia abbastanza liscia (interpolazione con spline): ad esempio di 2° grado, imponendo che sia derivabile anche nei 5 punti (e un'ulteriore condizione, ad es. che il primo tratto sia rettilineo) o di 3° grado, imponendo che sia derivabile fino al 2° ordine, e che le derivate seconde nel primo e nell'ultimo punto siano nulle (figura D).

    Sotto sono rappresentati graficamente gli esiti di 12 rilevamenti della portata d'acqua in m3/s (asse verticale) di un fiume italiano effettuati nel corso di un anno, a distanza di circa 30 giorni (asse orizzontale) l'uno dall'altro.   Per stimare la portata negli altri giorni l'intero fenomeno è stato approssimato (al centro) con una interpolazione lieneare e (a destra) con una spline cubica.

[Il file Portata.gfu contiene i dati sopra rappresentati. Il programma per QBasic Spline.bas che dato un file di punti per Poligon ne costruisce quello che ne rappresenta la spline cubica]

    Non si parla, invece, di interpolazione, ma solo di approssimazione, se si vuole trovare una funzione il cui grafico passi vicino ai vari punti noti, senza necessariamente passare per essi. Questo è ciò che si farebbe se si volessero individuare delle regolarità nel fenomeno e si cercasse di descriverlo in modo sintetico, o se (ma non è questo il caso) si trattasse di rilevamenti ad alta sensibilità, soggetti a errori casuali non stimabili a priori, per cui non avrebbe senso porsi il problema di trovare curve che passino esattamente per i punti sperimentali.

    Si parla di estrapolazione quando si cerca di prolungare un'interpolazione a sinistra (oltre il primo dato) o a destra (oltre l'ultimo).

    Noi non ci occuperemo di interpolazione. Elencheremo alcune tecniche generali di approssimazione.

  Metodi per individuare l'"andamento" di una serie di punti: uso di scale semilogaritmiche, bilogaritmiche, quadratiche e cubiche; calcolo e rappresentazione delle pendenze.

    Si veda l'help di POLIGON.

8

 Rappresenta graficamente con POLIGON il file DATI.gfu, ottenuto tabulando una funzione polinomiale. Quindi trasformarlo in scala bilogaritmica (X=Log(x), Y=Log(y), "Log": logaritmo decimale; in Poligon "LD"). Cerca di dedurre dal nuovo grafico grado e coefficiente direttivo della funzione polinomiale.

  

9

 Rappresenta il file TZ.gfu contenente la poligonale di distribuzione di T-ZOMBIE. Quindi trasformalo in scala semilogaritmica. Controlla se ottieni una figura come quella a lato. Cerca di dedurre che essa è approssimabile col grafico di una densità esponenziale e di determinare l'espressione di questa.

10

 Trasforma il file dati del quesito 8 per ottenerne il grafico della pendenza (=DERIV nel box "y": vedi l'help di POLIGON.). Ripeti questa operazione (trasforma il nuovo grafico) fino a che ottieni punti che tendono a disporsi su una retta orizzontale. Da ciò cerca di trarre conclusioni analoghe a quelle ottenute per il quesito 8.

– Se trasformassi analogamente un file contenente la tabulazione di una funzione esponenziale o di una funzione del tipo x xn x che cosa otterresti?

– Per spiegare questa tecnica sono indispensabili concetti di calcolo differenziale?

– Se trasformassi il file del ques. 8 operando sulle y la trasformazione y'=y^(1/3), che cosa otterresti?

  Una tecnica molto impiegata per approssimare dati è costituita dall'uso delle medie mobili (di ordine 3), in particolare per analizzare serie storiche.

11

 Utilizza questa tecnica per analizzare i dati relativi alle piogge a Genova contenuti nel file pioggia.gfu e, in particolare, per individuare i fattori stagionali (sotto sono già riprodotte alcune rappresentazioni grafiche). [vedi l'help di POLIGON; usa =medmob1]

  Le tecniche viste sono facilmente traducibili (almeno per l'aspetto numerico) anche in semplici programmi. Possono essere anche applicate ricorrendo a un foglio di calcolo. Ecco ad es. come usare un foglio di calcolo per analizzare i dati (1,2.25), (2,19.3), (3,65.2), (4,149), (5,302), (6,515), (7,820) con il metodo della pendenza. In questo caso δx è sempre 1, per cui invece che calcolare pendenze successive mi posso limitare a calcolare delle differenze successive:

- riproduco a destra la "formula" della cella B2 (automaticamente vengono modificati i riferimenti alle celle);

- riproduco la riga in basso più volte, saltando la prima cella;

    Dall'analisi della tabella, tenendo conto che i dati non sono esatti e che gli errori di approssimazione facendo le sottrazioni aumentano (ad es. se su 149, 302, 515 e 820 l'errore fosse 5, sulle differenze prime sarebbe 10 e sulle terze sarebbe 20), posso ritenere che le differenze terze siano in crescita e che le quarte si siano stabilizzate. Ne deduco la approssimabilità con un polinomio di 3° grado.

  
 ABCDEFG
12.2519.365.2149302515820
2 =B1-A1    
 
 ABCDEFG
12.2519.365.2149302515820
2 =B1-A1=C1-B1=D1-C1=E1-D1=F1-E1=G1-F1
3      
 
 ABCDEFG
12.2519.365.2149302515820
2 =B1-A1=C1-B1=D1-C1=E1-D1=F1-E1=G1-F1
3  =C2-B2=D2-C2=E2-D2=F2-E2=G2-F2
4   =D3-C3=E3-D3=F3-E3=G3-F3
 
 ABCDEFG
12.2519.365.2149302515820
2 17.0545.983.3153213305
3  28.8537.969.26092
4   9.0531.3-9.232

  Nel caso in cui si sia in grado di calcolare i valori di una funzione e si voglia capirne l'andamento, si può ricorre alla tecnica dei rapporti: se F(x), per x che tende all'infinito, tende all'infinito [a 0] come xn, allora all'aumentare di x il rapporto F(kx)/F(x) [F(x)/F(kx)] tende ad assumere il valore kn (nel caso dell' es. precedente si può osservare che il rapporto tra i valori assunti per x=2 e x=1, quello per x=4 e x=2, quello per x=6 e x=3 sono circa 8: al moltiplicare per 2 di x il valore della funzione tende a moltiplicarsi per 23).
    Questo metodo è molto comodo anche per studiare sperimentalmente ordini di infinito/infinitesimo. Se si conosce l'espressione di F(x), si può usare Poligon per definire, ad es., G(x)=F(2x)/F(x) [o F(x)/F(2x)] e studiare G mediante una tabulazione o una rappresentazione grafica. Lo studio è realizzabile anche un folgio di calcolo o con una semplice calcolatrice.

<<<     Paragrafo precedente Paragrafo successivo     >>>