Paolo ha raccolto il seguente elenco di dati; si tratta dei pesi (arrotondati ai kg) degli alunni maschi dell'ultimo anno della scuola superiore che frequenta.
64, 66, 73, 86, 70, 75, 68, 86, 88, 63, 73, 70, 69, 66, 77, 80, 80, 77, 82, 61, 77, 71, 59, 84, 86, 70, 77, 70, 97, 68, 66, 70, 70, 68, 70, 68, 81, 73, 61, 73, 59, 70, 68, 67, 70, 68, 64, 82, 86, 66, 68, 74, 64, 64, 62, 56, 70.
Decide di riorganizzare i dati sulla carta quadrettata nel seguente modo (a sinistra una fase iniziale, a destra come i dati si presentano alla fine):

 | | | | | | | | | | | | | | | | |
 | | | | | | | | | | | | | | | | |
6|4| | | | | | | | | | | | | | | |
6|6| | | | | | | | | | | | | | | |
7|3|0| | | | | | | | | | | | | | |  
7| | | | | | | | | | | | | | | | |
8|6| | | | | | | | | | | | | | | |
 | | | | | | | | | | | | | | | | |
 | | | | | | | | | | | | | | | | |
 | | | | | | | | | | | | | | | | |
 | | | | | | | | | | | | | | | | |
 | | | | | | | | | | | | | | | | |
5|9|9|6| | | | | | | | | | | | | |
6|4|3|1|1|4|4|4|2| | | | | | | | |
6|6|8|9|6|8|6|8|8|8|7|8|6|8| | | |
7|3|0|3|0|1|0|0|0|0|0|3|3|0|0|4|0|
7|5|7|7|7|7| | | | | | | | | | | |
8|0|0|2|4|1|2| | | | | | | | | | |
8|6|6|8|6|6| | | | | | | | | | | |
9| | | | | | | | | | | | | | | | |
9|7| | | | | | | | | | | | | | | |
 | | | | | | | | | | | | | | | | |

(1) Cerca di capire come ha proceduto e scrivi come spiegheresti per telefono a una persona che ha una sessantina di dati, con valori compresi tra 300 e 900, il modo in cui realizzare una rappresentazione simile.
(2) Quali sono i pregi, secondo te, di questa rappresentazione?

Paolo ha osservato che i dati stavano tra 50 e 100 e ha considerato che erano una cinquantina (57, ad essere precisi). Ha quindi pensato di classificarli in classi si ampiezza 5 e di riportare via via i dati sulla carta quadrettata mettendo in una prima colonna le possibili prime cifre (contate due volte, una per i dati con la seconda cifra minore di 5, l'altra per gli altri dati) e mettendo via via per ogni dato la seconda cifra in una nuova casella della corrispondente colonna, in modo da ottenere una specie di istogramma. I vantaggi sono quelli di ottenere una rappresentazione grafica della distribuzione ma, rispetto agli usuali istogrammi, di mantenere ulteriori informazioni sui singoli dati. Questa rappresentazione ha anche altri vantaggi; ad es. nel caso avessi dimenticato un dato potrei poi più facilmente individuarlo tenendo conto che ho "appilato" i dati nelle righe nello stesso ordine con cui li avevo nell'elenco.
Volendo (perdendo però quest'ultimo vantaggio, e con un procedimento in cui è più facile commettere errori di distrazione) avrei potuto riportare i dati sulla carta quadrettata nel modo seguente, ossia ordinando anche le cifre successive:

 | | | | | | | | | | | | | | | | |
5|6|9|9| | | | | | | | | | | | | |
6|1|1|2|3|4|4|4|4| | | | | | | | |
6|6|6|6|6|7|8|8|8|8|8|8|8|9| | | |
7|0|0|0|0|0|0|0|0|0|0|1|3|3|3|3|4|
7|5|7|7|7|7| | | | | | | | | | | |
8|0|0|1|2|2|4| | | | | | | | | | |
8|6|6|6|6|8| | | | | | | | | | | |
9| | | | | | | | | | | | | | | | |
9|7| | | | | | | | | | | | | | | |
 | | | | | | | | | | | | | | | | |

Il tipo di rappresentazione adottato da Paolo ha un nome: stem-and-leaf plot (o, in breve, stem plot). La cifra indicata nella prima colonna è il "gambo" (stem) del singolo dato, la cifra rimanente è la "foglia" (leaf); per ogni gambo ci possono essere più foglie (dati classificati nella stessa classe) ma un gambo può anche essere spoglio: nel nostro esempio non c'è alcun dato che sta in [9,9.5).
Il gambo potrebbe essere formato anche da più cifre. Ad es. nel caso delle altezze in cm degli stessi alunni (se fossero alti tra 150 e 209 cm) i gambi avrebbero potuto essere 15, 16, ..., 20.
    Nello stem-plot precedente è stato anche evidenziato il dato mediano.

Ecco come ottenere la rappresentazione con R:
dati <- c(64,66,73,86,70,75,68,86,88,63,73,70,69,66,77,80,
    80,77,82,61,77,71,59,84,86,70,77,70,97,68,66,70,70,68,
    70,68,81,73,61,73,59,70,68,67,70,68,64,82,86,66,68,74,
    64,64,62,56,70)
stem(dati)

Si potrebbe, indipendentemente dal quesito, usare anche questo semplicissimo script:

A = 55   B = 100   intervals = 9   their width = 5
n=57   min=56   max=97   median=70   1^|3^ quartile=66|77   mean=71.7719298245614

Vedi qui per approfondimenti.