t1 = "Dalle ringhiere del balcone pendevano e dondolavano pigre al vento le trecce di fichi, nere di mosche che correvano a sorbirne gli ultimi umori, prima che la vampa del sole li avesse tutti succhiati. Davanti all'uscio, sulla strada, sotto agli stendardi neri seccavano al sole, su tavole dai bordi sporgenti, liquide distese color del sangue di conserva di pomodoro. Sciami di mosche passeggiavano a piede asciutto sulle parti già solidificate, innumerevoli come il popolo di Mosè; altri sciami precipitavano e s'impegolavano nelle zone bagnate di quel Mar Rosso, e vi annegavano come eserciti di Faraone, impazienti di preda. Il grande silenzio della campagna pesava nella cucina, e il mormorìo continuato delle mosche segnava il passare delle ore, come la musica senza fine del tempo vuoto. Ma, a un tratto, dalla chiesa vicina, cominciava a suonare la campana, per qualche santo ignoto, o per qualche funzione deserta, e il suono riempiva lamentoso la stanza."

t2 = "A tutto ci si abitua, più in fretta di quanto non si creda. Anche a veder votare i ricoverati del 'Cottolengo'. Dopo un po', già sembrava la vista più usuale e monotona, per quelli di qua del tavolo: ma di là, nei votanti, continuava a serpeggiare il fermento dell’eccezione, della rottura della norma. Le elezioni in sé non c’entravano: chi ne sapeva nulla? Il pensiero che li occupava pareva essere soprattutto quello dell’insolita prestazione pubblica richiesta a loro, abitatori d’un mondo nascosto, impreparati a recitare una parte di protagonisti sotto l’inflessibile sguardo di estranei, di rappresentanti d’un ordine sconosciuto; soffrendone alcuni, moralmente e nel fisico (avanzavano barelle con malati e arrancavano le grucce di sciancati e paralitici), altri ostentando una specie di fierezza, come d’un riconoscimento finalmente giunto della propria esistenza. C’era dunque in questa finzione di libertà che era stata loro imposta – si domandava Amerigo – un barlume, un presagio di libertà vera? O era solo l’illusione, per un momento e basta, d’esserci, di mostrarsi, d’avere un nome?"

t3 = "– Niente ho. Voglio dormire.
– No, tu hai qualcosa... qualcosa contro di me.
– Perché dici questo?
– E allora abbracciami. Possibile che tu non abbia voglia di abbracciarmi?
– Ma che dici? Ne ho anche troppa, di voglia ... – Stette un momento in silenzio, poi disse: – Visto che dovrò andare lontano... e che dovremo stare divisi chissà per quanto tempo... puoi riprenderti la parola. Voglio dire, non sei più in obbligo di considerarti fidanzata con me. Ti ridò la tua libertà.
– Allora è vero che non mi vuoi più bene.
Lo sentì che si sollevava su un fianco.
– Ma non capisci che è perché ti voglio bene che ti dico così? Io ti voglio bene, Mara... e vorrei farti felice... ma se questo non è possibile, allora, è meglio che non pensi più a me. Potrai trovare un altro, che ti farà felice."

I precedenti brani sono tratti da romanzi di Italo Calvino, Carlo Cassola e Carlo Levi. Associa ad ogni brano il suo autore, il box-plot che rappresenta la distribuzione delle lunghezze delle parole che lo compongono e l'istogramma della distribuzione percentuale dei caratteri (cifre, lettere, spazi bianchi, virgole, punti e punti interrogativi ed esclamativi, parentesi, altri simboli) che lo compongono. Box-plot e istrogrammi sono nello stesso ordine.    

Il primo è di Carlo Levi (vedi, tratto da "Cristo si è fermato a Eboli", romanzo in cui Levi rievoca i personaggi e l'ambiente del confino che dovette trascorrere in un paese della Lucania nel 1935-36).  Il secondo brano è di Italo Calvino (vedi, tratto da "La giornata d'uno scrutatore", romanzo che racconta la giornata che Amerigo Ormea passa come scrutatore durante le elezioni del 1953).  Il terzo è di Carlo Cassola (vedi, tratto da "La ragazza di Bube": vedi).

Il brano di Cassola, il 3º, è quello con parole più brevi e con più spazi bianchi e più punti: corrisponde al terzo box-plot e al terzo istogramma.  Il brano di Calvino, il 2º, è quello con più apostrofi, trattini (ultima colonnina degli istogrammi): corrisponde al primo istogramma, e quindi anche al primo box-plot; è quello anche con più parole brevi e parole lunghe, a conferma che corrisponde al primo box-plot.  Il bramo di Levi, il 1º, corrisponde dunque al secondo istogramma e al secondo box-plot.

Ecco, nello stesso ordine (Calvino-t2, Levi-t1, Cassola-t3), gli istogrammi delle lunghezze delle parole, corrispondenti ai box-plot:

Per tracciare istogrammi come questi (e studiare la distribuzione delle parole) puoi vedere questo script (e i relativi esempi).

Per affrontare l'esercizio (e realizzare i grafici qui presenti) si può usare R (vedi qui, verso la fine del punto 20):

source("http://macosa.dima.unige.it/r.R")
analisiTesto(t1)
...