Questo collegamento permette di accedere a un brano che pubblicizza l'area del Porto Antico di Genova, sia in italiano che in inglese. Successivamente sono riprodotti gli istogrammi della distribuzione della lunghezza delle parole delle due versioni e sono indicate la media di tale lunghezza e i percentili (tra i quali la mediana). A destra sono raffigurati gli istogrammi di distribuzione delle lettere nelle tre categorie A, B e C.
Senza analizzare in dettaglio i brani, si cerchi di associare queste rappresentazioni alla versione corrispondente. Per controllare la risposta si faccia un'analisi statistica della lunghezza delle parole dei primi capoversi di entrambe le versioni e la si confronti con quella dell'intero brano.

Le rappresentazioni della prima "riga" si riferiscono alla versione in cui prevalgono parole più brevi: il 50% delle parole ha lunghezza tra 3 e 6 lettere, mentre nel caso rappresentato nella seconda riga sta tra 3 e 8 lettere, come è ben evidenziato dai box-plot. I valori della media confermano questa analisi. Tutto ciò, conoscendo la lingua inglese o dando un'occhiata alle due versioni del brano, fa subito supporre che la prima riga sia riferita alla versione in inglese.
    Gli istogrammi a destra confermano questa supposizione: in italiano le vocali - gruppo A - sono più frequenti che in inglese (le parole italiane finiscono in genere con una vocale), in inglese le dentali e le lettere "h", "k" e "j" - che stanno nel gruppo C - sono più frequenti che in italiano.
    Sotto sono riproddoti gli istogrammi a crocette che si possono ottenere scandendo i capoversi delle due versioni (una di 53 parole, l'altra di 47), con evidenziate le crocette che corrispondono alle mediane (crocette 24° e crocetta 27) e al 25° (crocetta 12 e crocetta 14) al 75° percentile (crocetta 40 e crocetta 35). Confrontando istogrammi e mediane con quelle dell'intero brano si ha una conferma di questa scelta. Un'ulteriore conferma la si otterrebbe calcolando le medie.
 ingleseitaliano
    123456789012345
 1  x
 2  xxxxxxx
 3  xxxmxxxxxxxxxxx
 4  xxxoxxxxxxx
 5  xxxxx
 6  wxxxxx
 7  xx
 8  xxx
 9  xx
 10
 11 x
   1234567890
1  x
2  xxxxxx
3  xxxxxxmxx
4  xx
5  xxxxxox
6  xxxxxxxx
7  xwxx
8  xxx
9  xx
10 x
11 x
12 xxx

  Per altri commenti: distribuzione, valori medi (2) e percentili neGli Oggetti Matematici.

  Per tracciare istogrammi come questi (e studiare la distribuzione delle parole) puoi vedere questo script (e i relativi esempi).

Sotto l'analisi fatta con R, introducendo il testo sostituendo le virgolette doppie con le virgolette semplici in quanto le virgolette doppie vengono impiegate per delimitare l'intero testo. Gli esiti sono leggernemte diversi in relazione a come vengono conteggiati alcuni caratteri speciali ("a capo", …).

source("http://macosa.dima.unige.it/r.R")

testo1 = "Few congress venues in Europe can boast such a scenic location. The 'Magazzini del Cotone' Congress Centre looks out over the waters of the old port from the 'Molo Vecchio' quay. The 'Porto Antico' is at the very heart of Genoa's old quarter, the liveliest and most picturesque part of the city.
Streets full of historical buildings, the main shopping thoroughfares, not to mention the alleyways full of craftsmen's workshops - they all lead down to the sea, to the traffic-free tranquillity of the old port.
Restored to the public domain in 1992 by architect Renzo Piano, this area is now a concourse of history, technology, culture and leisure.
It's the perfect venue for congresses, product launches, gala dinners, fashion shows - all manner of events. And for congress participants, there are plenty of things to do in work breaks and plenty of places to go to extend their stay and even bring the family along too."

testo2 = "Poche sedi congressuali in Europa possono vantare una collocazione altrettanto scenografica: il Centro Congressi dei Magazzini del Cotone, dalla banchina del Molo Vecchio si specchia nel bacino del Porto Antico, per secoli cuore della città. La parte storica di Genova, la più vivace e suggestiva, converge qui.
Le strade dei grandi palazzi storici, le vie dello shopping, i vicoli con le botteghe degli artigiani, seguono un percorso naturale che le porta a discendere verso il mare, nel Porto Antico, tranquilla enclave protetta dal traffico cittadino.
In questo spazio, reso alla città nel 1992 dalla sapiente regia di Renzo Piano, convivono oggi storia, tecnologia, cultura e strutture per il tempo libero.
Congressi, manifestazioni, presentazioni di prodotto, sfilate di moda e cene di gala trovano qui una collocazione piacevole e proposte differenziate per le pause dei lavori e per il prolungamento della permanenza dei partecipanti, con numerose possibilità di intrattenimento anche per la famiglia."

analisiTesto(testo1)
analisiTesto(testo2)
# per avere gli istogrammi finali nella stessa scala abbiamo messo:
maxIsto=24; maxIstoN=15; analisiTesto(testo1)
maxIsto=24; maxIstoN=15; analisiTesto(testo2)

922  caratteri 
  Vocali,  consonanti,  spazi bianchi,  punti (.?!),  altro: 
% 19.08894    59.97831    16.91974     0.7592191     3.253796

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  1.000   3.000   4.000   4.675   6.000  13.000 
    I pallini marroni sono 5° e 95° percentile 
           Il pallino rosso è la media

1011  caratteri 
  Vocali,  consonanti,  spazi bianchi,  punti (.?!),  altro: 
% 19.28783    62.8091     14.93571     0.4945598     2.472799 

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    1.0     3.0     5.0     5.4     7.5    15.0 
    I pallini marroni sono 5° e 95° percentile 
           Il pallino rosso è la media