more

Accettato per la pubblicazione su:L'insegnamento della matematica e delle scienze integrate

SOFTWARE PER L'INSEGNAMENTO DELLA MATEMATICA:
INTRODUZIONE ALLA STATISTICA

Stefania Delucchi 
Nucleo di Ricerca Didattica MaCoSa
presso il Dipartimento di Matematica dell'Università di Genova
via Dodecaneso, 35 - 16136 Genova
macosa@dima.unige.it

01

Introduzione e considerazioni generali

02-04   

Modelli statistici elementari

05-06

Strumenti per l'elaborazione delle informazioni

07-09

Indici di posizione

10-12

StatFile

13

Indici di posizione

Riferimenti

Introduzione

01    Questo articolo sviluppa le considerazioni introdotte in [2] prendendo in esame l'impiego del computer nell'insegnamento nella scuola secondaria superiore della statistica elementare, disciplina che, pur essendo ormai presente nei curricula del biennio, spesso viene trascurata o affrontata alla fine, come argomento a sé, senza sfruttarne i collegamenti con altri temi matematici.
    Attraverso alcuni esempi si cercherà di mettere in luce come il computer:
  sia oggi uno strumento indispensabile e integrato alle attività statistiche (senza di esso non si possono analizzare numericamente e graficamente quantità significative di dati, e la nascita e la forma dei nuovi concetti statistici è legata alla presenza del computer),
  possa essere impiegato per introdurre in modo intuitivo e/o sgravato da aspetti calcolistici concetti e proprietà che altrimenti, per la loro complessità, non sarebbero affrontabili,
  faciliti o stimoli l'integrazione con altre aree matematiche.
    Il software a cui ci si riferirà in alcuni casi è il foglio di calcolo elettronico, in altri è costituito da Stat, StatFile o Grafun, applicazioni software elaborate nell’ambito del progetto MaCoSa ( [10]). Considerazioni generali su questo software, in particolare su Grafun, sono presenti in [2], dove sono approfonditi anche alcuni aspetti generali e teorici sull’impiego del calcolatore nell’insegnamento della matematica. In altri casi verrà proposto anche l’uso della calcolatrice tascabile (CT) e di semplici programmi in Basic strutturato (sulla scelta di questo linguaggio di programmazione:  [2]).
    Nell'ambito del progetto si è scelto di non usare applicazioni statistiche più complesse, come ad esempio Minitab, oltre che per problemi di licenza, anche per non aggiungere difficoltà tecniche di utilizzazione del software a quelle connesse alla comprensione dei nuovi argomenti (ciò non esclude un loro successivo impiego per attività più specifiche in alcuni indirizzi scolastici). Inoltre, il "nostro" software è stato realizzato in modo da poter gestire con facilità sovrapposizioni e confronti di grafici non facilmente realizzabili con Minitab.
    Nel progetto abbiamo dato molto rilievo, sin dalle prime unità didattiche, alla statistica in quanto essa si presta molto bene ad affrontare semplici problemi di modellizzazione mediante strumenti matematici elementari, consentendo di mettere in luce la natura dei modelli matematici: ruolo e fasi della matematizzazione, valutazione dell’efficacia e dei limiti dei modelli, … .
    Per esemplificazioni più estese di attività didattiche (di matematizzazione riferite alla statistica e di integrazione tra statistica ed altre aree) si rimanda a [7].
    Per approfondimenti tecnici si rinvia a [1], [6], [11] e [12], oltre che a [8], che può essere utilizzato direttamente per attività di formazione in servizio e in cui sono sviluppati alcuni degli esempi trattati nel presente articolo assieme ad altri riferiti più specificamente all'insegnamento della probabilità e della statistica inferenziale, sul quale si soffermerà un successivo articolo. Altre considerazioni ed esemplificazioni sono presenti in [4], che documenta le prime elaborazioni del Gruppo su questi temi, e in [5], in cui sono motivate le scelte culturali e didattiche operate in [8].

Modelli statistici elementari

02    L'analisi di variabili statistiche qualitative può costituire un semplice approccio alla statistica. Introducendo i soli concetti elementari di distribuzione e distribuzione percentuale ed alcune rappresentazioni grafiche è possibile, partendo ad esempio dai dati della tabella-Istat riportata alla fine di 03, fare delle considerazioni su come è mutata la distribuzione delle spese degli Italiani (cioè la distribuzione della variabile "settore di spesa") dal 1926 al 1985. A tale scopo ci si può servire, in prima battuta, della CT e della carta millimetrata, successivamente di un programma (da redigere o solo da utilizzare) o di un foglio di calcolo. Le rappresentazioni che seguono la tabella sono state ottenute usando il programma Stat.

03    Attività come questa, riferite a concetti già introdotti nella scuola dell’obbligo, se proposte all’inizio del biennio, danno l’opportunità sia di valutare il livello di ingresso della classe, sia di mediare il passaggio a una sistemazione più formalizzata dei concetti.
    Ad es. l’utilizzo di istogrammi relativi a modalità non numeriche permette di riprendere l'uso dei grafici e l’associazione tra numeri e punti in una situazione semplice, in quanto riferita ad una sola retta numerica (l'asse orizzontale non è una retta numerica). Rivedendo e sviluppando il concetto di proporzionalità diretta si può poi introdurre la rappresentazione grafica delle funzioni lineari.
    La realizzazione delle rappresentazioni proporzionali (calcolo delle distribuzioni percentuali, dell'ampiezza dei settori circolari, …) pone problemi (quante cifre considerare? perché la somma delle frequenze percentuali ottenute non è esattamente 100% o quella delle ampiezze dei settori non è 360°? …) che introducono al calcolo numerico elementare (approssimazioni, ordini di grandezza, cifre significative, notazione esponenziale, …) e consente di avviare al concetto di numero reale.
    Questo contesto offre anche l’opportunità di introdurre formule e variabili in modo motivato (per descrivere in modo sintetico e generale le elaborazioni numeriche da eseguire) e tale da consentire e stimolare forme di controllo e autocorrezione sulle manipolazioni eseguite (interpretare nella "situazione" i risultati numerici ottenuti, confrontarli tra loro e con le relative rappresentazioni grafiche, …), favorendo l’interiorizzazione dei concetti.

anno

alimentari

tabacco

vestiario

abitazione

trasporti

altro

totale

in milioni di lire

1926

77749

3226

17659

6849

3420

15302

124205

in miliardi di lire

1985

116148

9306

35756

45238

58919

168733

434100


04    Attività come questa, semplici e realizzate con strumenti elementari, consentono anche di mettere bene a fuoco il concetto di modello matematico. Introdurre per gli stessi dati rappresentazioni diverse (dati assoluti, percentuali, istogrammi, diagrammi circolari, grafici in funzione del tempo, …) consente di mostrare vantaggi e svantaggi di ciascun modello, evidenziando gli aspetti del problema che ognuno di essi esclude o approssima. Il riferimento ai contesti consente di mettere in luce l'opportunità di tener conto dei limiti dei modelli: dall'istogramma e dalle percentuali si potrebbe dedurre che nel 1985 si spendeva in alimenti meno che nel 1926, mentre occorre tener conto che è calata solo l'incidenza relativa di questa voce di consumo (trasformati i dati del 26 in lire dell'85 e utilizzando i dati relativi alla popolazione si trova che mediamente un italiano ha speso di più anche in alimenti; infatti è aumentata la spesa complessiva: per "sopravvivere" sono diventati necessari nuovi beni e servizi: elettrodomestici, trasporti, istruzione, …).
    Per un altro esempio si pensi alla introduzione dei numeri indici per confrontare l'evoluzione della specialità del salto in alto per gli uomini e per le donne: essi consentono di evidenziare i maggiori progressi rispetto al 1932 verificatisi in campo femminile, ma sembrano suggerire che le donne continuino a guadagnare rapidamente terreno sugli uomini. L'ulteriore modellizzazione attraverso le variazioni percentuali ogni 4 anni (non rispetto al 1932) consente una migliore interpretazione del fenomeno. Si vedano i grafici seguenti.

Strumenti per l'elaborazione delle informazioni

05    Come accennato in 02, l’introduzione dei primi concetti statistici può costituire un contesto significativo per l’avvio all’automazione degli algoritmi, dalla riorganizzazione dei calcoli in modo da ottimizzare l'uso della calcolatrice, al come ovviare ai problemi di approssimazione che si incontrano nella costruzione degli areogrammi a settori circolari (vedi 03): l'osservazione che Stat riesce a superare questa difficoltà può motivare la messa a punto di un procedimento che, calcolando man mano la frequenza assoluta cumulata, consenta di determinare direttamente la posizione dei raggi separatori senza sommare valori approssimati, e nella successiva implementazione con la CT (usando [M+]) e con un semplice linguaggio di programmazione o un foglio di calcolo. ( [7]).

06    L'ambito della statistica elementare, oltre a offrire contesti (calcolo di distribuzioni, medie, …) per l'implementazione di algoritmi semplici ma significativi dal punto di vista informatico, consente di mettere a fuoco in modo motivato le varie forme di introduzione degli input e le differenze nella gestione dei dati delle diverse applicazioni (fogli di calcolo, linguaggi generali e programmi applicativi):
  separazione/integrazione di dati, algoritmo e uscite (celle di dati e celle di formule, finestre di input/output e di lista, file di programma e file di dati, istruzioni data/read, finestre di dialogo o istruzioni per configurare uscite numeriche e grafiche, ...)
  uso delle variabili indiciate, realizzazione dei cicli, … (indici fisici o indici logici, riproduzione di formule o cicli-for, rettangoli di celle o variabili indiciate, ...)
  flessibilità e interazione con altre applicazioni, convenienza a seconda della complessità dell'algoritmo, della quantità dei dati, ...
    Ad esempio i grafici alla fine di 04 per essere realizzati con un foglio di calcolo richiedono (a meno che qualcuno non abbia pre-elaborato opportune macro) la costruzione di varie righe di formule mentre con un programma specifico, come Grafun, essi possono essere realizzati operando con opportuni comandi direttamente sui file di dati; inoltre le elaborazioni numeriche vengono registrate in nuovi file, che, come i precedenti, possono essere letti e modificati con un qualunque editor ed essere poi rappresentati sovrapponendosi ad altre rappresentazioni grafiche (con un foglio di calcolo occorre invece realizzare contemporaneamente le rappresentazioni grafiche che si vogliono confrontare sullo stesso sistema di riferimento). Più avanti si vedrà come Grafun si interfacci con il programma statistico StatFile.

Indici di posizione

07    L'analisi di variabili statistiche quantitative (o, comunque, ordinabili:  09) comporta elaborazioni statistiche più complesse in cui l'uso del computer si dimostra decisivo per la trattazione dei dati e didatticamente utile, in quanto consente di concentrare l'attenzione maggiormente sugli aspetti concettuali, che non sono affatto banali.
    I ragazzi, tramite le statistiche presentate nei giornali o alla televisione (o in libri di geografia o altre materie), hanno già l’idea intuitiva di valore medio (identificato per lo più con la media aritmetica) come di un numero impiegato per sintetizzare il comportamento di un certo fenomeno, ma, in genere, non sono consapevoli dei limiti di queste modellizzazioni, non solo legati al fatto che esse possono essere frutto di indagini su campioni poco rappresentativi, ma insiti nel concetto stesso di media aritmetica (su questi ci soffermeremo in 09).
    Sul concetto di media sono diffuse anche misconcezioni. A confusioni concettuali in ambito statistico abbiamo implicitamente accennato riferendoci alle percentuali e ai numeri indici, altre (per le quali rimandiamo a [7]) sono legate alla composizione di variazioni percentuali (spesso confuse con la loro somma), all'uso dei valori medi che esprimono rapporti tra grandezze ( ad es. la velocità media o la densità di popolazione il cui valore su un intervallo di tempo o una regione non è la media dei valori sui sottointervalli o le sottoregioni), alla presenza di fattori di scala (negli ideogrammi occorre usare scale quadratiche o cubiche) e alla lettura degli istogrammi (su quest'aspetto ci soffermeremo in 10).
    Nel caso della media aritmetica alcune difficoltà concettuali sono legate alla sua interpretazione come operazione su un "insieme di numeri". L'uso di programmi come Stat, di molte CT o di un foglio di calcolo, coi quali è facile calcolare media aritmetica e somma di un certo numero di dati, aggiungere dati, ..., può aiutare a percepire la media come una funzione avente come dominio "sequenze" di lunghezza finita di numeri reali. A livello di biennio non è significativo e sarebbe troppo complesso definire formalmente questo dominio, ma può valere la pena far provare, con lo strumento scelto, come inserendo come input ad esempio (3,3,7) si ottenga un risultato diverso che inserendo (3,7), mentre, insiemisticamente, {3,3,7} e {3,7} indicano lo stesso oggetto matematico. Per quanto riguarda l’elaborazione di dati "dotati di frequenza", mentre non si hanno problemi ad usare Stat o una CT, può essere utile far riflettere i ragazzi sul motivo per cui non è possibile usare la funzione predefinita di media (o altre funzioni statistiche predefinite) dei fogli di calcolo.
    Altri problemi sorgono quando si ha a disposizione solo una classificazione dei dati, cioè una sequenza di intervalli con le relative frequenze. Per valutare la media occorre, ad es., supporre che all’interno di ciascun intervallo i dati si distribuiscano uniformemente, in modo da potersi ricondurre al caso precedente rappresentando ogni intervallo come dato avente come valore il centro dell'intervallo stesso.
    Non crea particolari problemi l'uso del termine variabile per indicare la grandezza analizzata statisticamente e l'impiego di espressioni come "i valori della variabile ... che cadono in ... sono ...": infatti essa viene indicata con un nome (altezza, età, ...) a cui si possono associare vari valori, analogamente a quanto accade in ambito "algebrico". Tuttavia, pur gradualmente, è bene, sin dall'inizio, mettere a fuoco le diverse caratteristiche delle variabili casuali e di quelle deterministiche. Per un approfondimento della questione e un confronto tra le diverse formalizzazioni del concetto di variabile casuale, rinviamo a [8].

08    Le attività sulle medie offrono ulteriori intrecci con altre aree matematiche: si pensi alla messa a punto di algoritmi per facilitare il calcolo della media aritmetica in casi di dati particolari (ad es. dati tutti vicini a un particolare valore o dati di segni diversi), alla loro generalizzazione e traduzione in formule, alla verifica della equivalenza algebrica tra queste; l'uso di Stat o di una CT dotata di tasti statistici può consentire di congetturare o controllare sperimentalmente queste proprietà, anche attraverso esercizi del tipo "trova 3/4/... numeri diversi la cui media sia 50". Si tratta di attività algebriche in cui gli studenti hanno la possibilità di controllare semanticamente (dal punto di vista numerico e del significato contestuale delle singole manipolazioni formali operate) il procedimento seguito. La sperimentazione con mezzi di calcolo può condurre anche all'osservazione che termini algebricamente equivalenti possono non essere tali dal punto di vista del calcolo numerico.
    Per un esempio particolare, si consideri la possibilità di interpretare come media aritmetica (a+b)/2 il centro dell'intervallo [a, b], il cui modello matematico "naturale" sarebbe a+(b-a)/2, e al confronto tra i due termini: nel calcolo mentale, a seconda dei valori di a e b, può convenire l'uno o l'altro, dal punto di vista di un mezzo di calcolo, il primo comporta meno operazioni ma può essere meno "preciso": se a=6.1234566 e b=6.1234568, utilizzando il primo termine con una CT ad 8 cifre si ottiene 6.1234565, mentre col secondo si ha 6.1234567.
    Sempre a proposito di approssimazioni, si pone il problema di quante cifre significative considerare nella media di m dati considerati con n cifre significative. Sebbene a questo livello non sia possibile affrontare esaurientemente l'argomento (che potrà essere ripreso con l’introduzione del Teorema Limite Centrale), va tuttavia svolta qualche prima considerazione intuitiva/operativa (se i dati sono arrotondati al posto J e sono una decina / un migliaio / ... puoi arrotondare la media, rispettivamente, al posto J-1 / J-2 / ...) e messa a fuoco la differenza tra il caso dei dati approssimati e quello dei dati troncati (per questi occorre aggiungere mezza unità alla media); per approfondimenti ed esempi si rinvia all'help di Statfile.

09    Un altro aspetto importante da mettere a fuoco è quello dei limiti del modello "media", legati sia alla perdita di informazioni sulla distribuzione dei dati, sia all'impossibilità di utilizzo nel caso di variabili qualitative. Al riguardo può essere didatticamente utile introdurre e confrontare altri valori medi.
    La media può essere usata come indicatore di posizione anche per una variabile non numerica solo quando abbia senso ordinare le modalità (cioè i "valori" che la variabile può assumere): ad esempio le regioni ordinate per latitudine del capoluogo, qualifiche di una categoria di lavoratori, titolo di studio. In queste situazioni si possono etichettare ordinatamente le modalità con numeri naturali, far la media di questi e "convenire" di considerare come "modalità media" quella associata all'arrotondamento del numero ottenuto ( [8]).
    Considerazioni analoghe valgono per la mediana; nel caso di dati già classificati si può assumere l'ipotesi di uniformità come si è fatto per la media (a questa ipotesi corrisponde l'assunzione che la frequenza cumulata sia una funzione lineare in ciascun intervallo, per cui la mediana viene stimata mediante un ragionamento di proporzionalità:  [7]). Il calcolo della mediana offre anche agganci "informatici" (uso e confronto di comandi e/o algoritmi di ordinamento) e non (concetti di ordinamento e, nel triennio, ordine di infinito, ...:  [9], scheda 8).
    La moda è una funzione più "complicata" rispetto a media e mediana: ha come insieme di input o dati classificati o una sequenza di dati numerici più il modo in cui classificarli (in genere, per dati numerici, si forniscono un intervallo [a, b] che li contenga e il numero dei sottointervalli in cui suddividerlo), e non è univoca: ha come output una o più modalità o intervalli (per esempi didattici ( [8]). È solo nel caso dell'analisi teorica delle variabili casuali continue che la moda diventa un numero: è una moda ogni massimo assoluto della funzione densità ( [7]).
    Nei prossimi paragrafi verranno approfondite le diverse potenzialità di media, moda e mediana.

StatFile

10    Statfile è un programma che consente di creare file di dati numerici (classificati o da classificare) e di analizzarli statisticamente (per dati non numerici è necessario etichettare le modalità con dei numeri). I file sono di "lettura" trasparente e possono essere costruiti, letti o modificati direttamente con un semplice editor (come Edit del Dos o Blocco Note di Windows).
    Nella figura seguente è riportato che cosa si può ottenere analizzando con Statfile i pesi (non ancora classificati in intervalli) dei ragazzi liguri rilevati alle visite di leva per la Marina nel 1997.

    Il successivo esempio mostra invece l'utilizzo di STATFILE per l'analisi di dati già classificati, in questo caso i dati relativi all’età di morte in Italia nel 1951 e nel 1990, classificati in intervalli di età diversi.

    Sono riportati per gli stessi dati sia (a destra) gli istogrammi in cui le frequenze sono rappresentate dalle altezze delle colonne sia (a sinistra) quelli in cui sono rappresentate dalle loro aree (le altezze in questo caso sono le frequenze percentuali unitarie, o densità di frequenza): è utile introdurre questi ultimi sia perché il confronto tra i due tipi di rappresentazione consente di mettere a fuoco meglio il (e far emergere/superare misconcezioni sul) problema di come associare grandezze quantitative e entità geometriche ( [7]), sia perché il secondo tipo di istogrammi, oltre a rappresentare meglio l'andamento del fenomeno in esame (in quanto rappresenta proporzionalmente gli intervalli di età), consente anche di confrontare dati riferiti alla stessa variabile ma diversamente classificati e di individuare l'eventuale stabilizzarsi della forma dell'istogramma all'aumentare dei dati e del numero degli intervalli in cui classificarli; consente, in altre parole, di introdurre il concetto di funzione di densità.
    A questo fine si è introdotta in STATFILE la possibilità di salvare gli istogrammi delle densità di frequenza in un formato leggibile con GRAFUN, in modo da consentire attività di congettura di funzioni di densità e leggi di distribuzione e/o di confronto tra istogrammi sperimentali e curve/istogrammi teorici. Vi è pure la possibilità di salvare in formato GRAFUN la funzione frequenza cumulata, la cui rappresentazione è utile anche per comprendere come vengono calcolate mediana e percentili (vedi 09) e avviare al concetto di funzione di ripartizione. Riportiamo qui di seguito, a sinistra, i grafici della frequenza cumulata relativi ai dati sopra considerati (età di morte nel 1951 e 1990), con l'indicazione di come da essi si possono ricavare valutazioni dei percentili, in particolare, della mediana (50° percentile): è la controimmagine di 50/100, cioè l'età entro cui sono morti il 50% dei deceduti nell'anno considerato.
    La parte destra della figura è discussa nel prossimo paragrafo.

11    Il confronto tra i due file può essere ulteriormente approfondito esaminando le caratteristiche numeriche fornite da STATFILE. In questo caso (vedi la seconda figura di 10) sia media che mediana danno un'idea di come, nel complesso, è aumentata l'età di morte delle persone anche se per questo tipo di distribuzione (non simmetrica) la mediana è un indicatore più adeguato in quanto non è influenzata da come si distribuiscono i dati verso gli estremi dell'intervallo. Analoghe considerazioni possono essere fatte per quanto riguarda gli indici di dispersione scarto quadratico medio e distanza interquartile (differenza tra 75° e 25° percentile): il secondo, oltre a essere spesso più rappresentativo, è di più immediata comprensione nel suo significato statistico (non è facile percepire la natura del legame tra entità dello s.q.m. e dispersione dei dati).
    STATFILE rappresenta i dati anche sotto forma di box-plot, che sintetizzano in una figura "lineare" informazioni sia sulla posizione che sulla dispersione dei dati (il "box" rappresenta la collocazione del 50% centrale dei dati, la tacca che lo taglia indica la mediana, le tacche lungo i "baffi" indicano il 5° e il 95° percentile) e si rivelano utili anche per confrontare l'evoluzione temporale di un fenomeno. Ad es. nella precedente figura sono riprodotti alcuni box-plot relativi all'età di morte nell'ultimo secolo.
    I percentili possono costituire un primo strumento per affrontare problemi del tipo "si consideri un particolare valore assunto da una variabile e si valuti se può essere considerato normale", problemi che, oltre a introdurre importanti sviluppi probabilistici, possono essere riferiti a contesti reali particolarmente motivanti e coinvolgenti per alunni in fase adolescenziale ("il mio peso è normale?", "sono abbastanza alta?", ...).
    Spesso i ragazzi cercano risposta alle domande citate consultando tabelle e indicazioni che si trovano su riviste o opuscoli pubblicitari e che, in genere, proponendo le situazioni "ideali", nascondono i limiti dei modelli utilizzati, cioè la convenzionalità dei criteri scelti, la dispersione associata agli indicatori medi, ... e la presenza di correlazioni con altra variabili (ad esempio tra peso e struttura ossea, altezza e regione di provenienza, ...).

12    STATFILE lavora con variabili casuali a uscite in R (o, meglio, in numeri macchina a virgola mobile). Si pone dunque il problema di come analizzare dati interi, come ad esempio quelli relativi all'esito del lancio ripetuto di un dado o a variabili qualitative codificate numericamente (vedi 09). In casi come questi la variabile aleatoria ha come dominio un segmento di N. Per tracciare l'istogramma si può allora considerare un intervallo reale che contenga tale dominio e suddividerlo in classi centrate sui valori di tale dominio.
    Queste considerazioni possono inserirsi in riflessioni più generali sul concetto di numero reale, inteso come modello matematico che consente di facilitare e/o generalizzare l'analisi dei fenomeni: dal fatto che, anche se le misure di grandezze fisiche ci sono note solo come decimali limitati (e se le grandezze stesse sono in realtà discrete, e il loro rilevamento è soggetto al principio di indeterminazione), è utile modellizzarne le relazioni mediante formule a variabili reali, al fatto che ha senso parlare di valori medi non interi anche nel caso di variabili casuali intere (3.5 è la media dell'uscita di un dado) e, più in generale, di considerare valori medi con più cifre significative dei dati analizzati (vedi 08). Si tratta di considerazioni che troveranno sviluppo nella formalizzazione del concetto di variabile casuale continua, nell'impiego del generatore di numeri casuali - con distribuzione uniforme in [0,1) - per simulare fenomeni discreti, ...

Ruolo delle rappresentazioni grafiche

13    Negli esempi riportati si è fatto largo uso di rappresentazioni grafiche (grafici a punti congiunti, istogrammi, areogrammi, box-plot, ecc.) innanzitutto perché nelle pubblicazioni, nelle professioni, ... le valutazioni statistiche sono presentate sempre più spesso in forma grafica, ritenuta di più immediata lettura e più facile interpretazione, anche da parte di persone che non possiedono nozioni di statistica particolarmente approfondite, oltre che dotata di una peculiare potenza informativa ed espressiva (vedi [3]): insegnare statistica senza riferimenti alla grafica sarebbe anacronistico e cognitivamente poco efficace, e non offrirebbe agli alunni motivazioni e occasioni di riscontro/esercizio in contesti extrascolastici.
    Occorre, poi, tener conto del fatto che spesso, ad esempio in ambito pubblicitario, ma non solo, vengono utilizzate rappresentazioni grafiche errate o ambigue (per ignoranza e/o al fine di indurre convinzioni non vere negli utenti): l'educazione all'uso delle rappresentazioni grafiche è quindi importante anche per prevenire/superare misconcezioni ed educare all'uso critico delle informazioni.
    Oltre a queste motivazioni generali, ve ne sono altre legate più strettamente all'apprendimento/insegnamento della matematica, come quella di rafforzare negli studenti la capacità di associare aspetti geometrici (forma, presenza/assenza di simmetrie, pendenza, ...) ad aspetti numerici ed analitici, che, ovviamente, deve essere sviluppata in modo integrato attraverso attività di geometria analitica e delle trasformazioni.
    Vi è, infine, la motivazione più specifica, già richiamata, di avviare, attraverso l'uso degli istogrammi di densità di frequenza e l'analogia con il concetto di area, al concetto di funzione di densità. La geometria, quindi, può essere un elemento di mediazione nel passaggio dalla statistica descrittiva alla probabilità. Su questo aspetto e su altri legami tra geometria e statistica/probabilità (ad esempio nell'ambito dell'analisi bivariata) e tra questa e l'analisi infinitesimale ci si soffermerà in un successivo articolo.

Riferimenti

[1]Byrkit D.R.: 1987, Statistics Today, Benjamin-Cummings, Menlo Park
[2]Capelli, L., Dapueto, C. & Greco, S.: 1999, 'Software per l’insegnamento della matematica: rappresentazione grafica di funzioni ed equazioni', L'insegnamento della matematica e delle scienze integrate, vol. 22B, n. 2
[3]Dapueto, C.: 1999, 'Analogical and digital artifatcts: cultural and didactical problems', Proceedings of 'Workshop on Graphic and Digital Representations in Teaching/learning Mathematics' (Genoa, 1998), Dipartimento di Matematica, Università di Genova
[4]Dapueto, C., Ghio, S. & Pesce, G.: 1994, 'Probabilità e Statistica nel biennio: nodi culturali e didattici da affrontare', I e II parte, L'insegnamento della matematica e delle scienze integrate
[5]Delucchi,S.:1995, Progettazione e sperimentazione di un corso di aggiornamento sull’insegnamento della probabilità e la statistica nella scuola secondaria superiore, Tesi di laurea, Università di Genova
[6]Gilchrist, W.: 1984, Statistical Modelling, John Wiley, New York
[7]Gruppo Didattico MaCoSa: 1997, Matematica per Conoscere e per Sapere, Schede di lavoro - Gli Oggetti Matematici, Editrice Maggi, Ceranesi
[8]Gruppo Didattico MaCoSa: 1997, Probabilità, Statistica ed Elaborazione automatica delle informazioni: aspetti teorici e didattici, Rapporto Tecnico, Dipartimento di Matematica dell’Università, Genova
[9]Gruppo Didattico MaCoSa: 1997, Matematica e Calcolatore, Rapporto Tecnico, Dipartimento di Matematica dell’Università, Genova
[10]http://www.dima.unige.it/macosa
[11]Rogantin, M.P.: 1996, Introduzione alla Statistica con esempi sviluppati in linguaggio Minitab, CLUT, Torino
[12]  Ventsel E. S.: 1983, Teoria delle probabilità, Edizioni Mir