Vengono scelti a caso 300 statunitensi, che vengono suddivisi per convinzioni politiche e per sesso. Si ottiene la seguente tabella di contingenza:
democratici repubblicani indipendenti femmine 68 56 32 maschi 52 72 20Si rappresentino graficamente i profili riga e si valuti l'indipendenza del sesso e dell'orientamento politico.
Ricordo che i "profili riga" non sono altro che le distribuzioni percentuali riga per riga.
Si può procedere con un foglio di calcolo, con R o con dei semplici script, come faremo ora.
Con questa calcolatrice calcolo le distribuzioni percentuali:
metto in d e clicco [=] ottengo il risultato in f metto in g copio f in j e clicco [data·Q] ottengo in k metto in g con [copy] metto 1 in e e clicco [round] |
100/(68+56+32) 100/(68+56+32) = 0.6410256410256411 68, 56, 32 Q = 0.6410256410256411 data*Q: 43.58974358974359, 35.8974358974359, 20.512820512820515 43.58974358974359, 35.8974358974359, 20.512820512820515 43.6, 35.9, 20.5 |
Questa era la distribuzione percentuale relativa alle femmine. Analogamente per i maschi ottengo 36.1, 50, 13.9.
Questi sono i due profili riga. Per rappresentarli graficamene in modo facile uso lo script
bar graphs (of sequences):
Data: 1*43.5, 2*35.9, 3*20.5, 4*0, 5*36.1, 6*50, 7*13.9 Names: F_De, F_Re, F_ In, ,M_De, M_Re, M_ In |
Sia dai grafici che dai valori numerici risulta evidente che non si può accettare l'ipotesi che sesso e convinzioni politiche degli americani (relativamente al periodo dell'indagine) siano indipendenti.
Per altri commenti: Sistemi di variabili casuali neGli Oggetti Matematici.
Vediamo come si può procedere con R (vedi):
source("http://macosa.dima.unige.it/r.R") # If I have not loaded the library # I dati, colonna per colonna, e le dimensioni della tabella T0 = c(68,52, 56,72, 32,20) T = array(T0, dim=c(2,3)); T # [,1] [,2] [,3] # [1,] 68 56 32 # [2,] 52 72 20 # aggiungo i "nomi" name = list(c("F","M"), c("demo.","repu.","indi.")) T = array(T0, dim=c(2,3), dimnames=name); T # demo. repu. indi. # F 68 56 32 # M 52 72 20 # le percentuali: T1 = array(round(T0/sum(T0)*100,1), dim=c(2,3), dimnames=name); T1 # demo. repu. indi. # F 22.7 18.7 10.7 # M 17.3 24.0 6.7 # I "profili riga" non sono altro che le distr. % riga per riga bar(T[1,]); abovex("F"); bar(T[2,]); abovex("M") # % 43.58974 35.89744 20.51282 # % 36.11111 50 13.88889# Una migliore rappresentazione (su un'unica immagine): D = c(43.58974, 35.89744, 20.51282, 0, 36.11111, 50, 13.88889) co = c("pink","green","yellow"); col=(c(co,0,co)) BARM(D,col, 50, (1:5)*10) aboveX(c("demo","repu","indi","demo","repu","indi"),c(0.5,1.5,2.5,4.5,5.5,6.5)) underX(c("F","M"),c(1.5,5.5)) # Volendo posso rappresentare anche il grafico a mosaico: mosaicplot(T) # o, trasponendo: mosaicplot(t(T))
Sia dai grafici che dai valori numerici risulta evidente
che non si può accettare l'ipotesi che sesso e convinzioni politiche degli americani (relativamente
al periodo dell'indagine) siano indipendenti.