Qui trovi due brani tratti da Internet, uno da un testo scientifico, l'altro da una recensione di un romanzo. Associa a ciascuno di essi l'istogramma e il box-plot che rappresentano la distribuzione delle lunghezze delle parole che li compongono. Motiva la risposta.

Sotto sono riprodotti, in ordine, gli istrogrammi di distribuzione dei caratteri di "testo2" (una brano tratto da una recensione del romanzo giallo "Io uccido" di Faletti) e di "testo1" (un brano sulle antiche rappresentazioni dei numeri). Il brano "testo1" contiene molte cifre, e molte "parole" composte da 1, 2 o 4 cifre. Questo porta a concludere che ad esso corrisponde il secondo istogramma e il secondo box-plot, a cui corrisponde la mediana 3; la media è più alta, e ciņ corrisponde al fatto che l'istogramma ha una accentuata coda verso destra.

Per affrontare l'esercizio (e realizzare i grafici qui presenti) si puņ usare R (vedi qui, verso la fine del punto 20):

source("http://macosa.dima.unige.it/r.R")
analisiTesto(t1)
...