>>>>>

Scheda 7- Analisi bivariata

3. COVARIANZA e CORRELAZIONE.

    Abbiamo visto (ques.4) che X e Y (ascissa e ordinata in [-1,1]) di BERSAGL1 e BERSAGL2 non sono stocasticamente indipendenti: il valore assunto da X condiziona il valore che può assumere Y. Tuttavia i punti si dispongono intorno a (0,0) senza privilegiare alcuna direzione. Nel caso dell'ultimo esempio (ques.5), invece, si vede che, all'aumentare di X, Y tende ad aumentare proporzionalmente: le curve di livello sono tutte allungate con una ben precisa inclinazione. Per distinguere queste situazioni, in entrambe delle quali X e Y sono dipendenti, si dice che X e Y nel secondo caso sono correlate, nel primo no. Sperimentalmente, la correlazione corrisponde alla tendenza dei punti (X,Y) (nel grafico di dispersione) a disporsi lungo una retta obliqua.

    Per "misurare" questa tendenza, si usa il concetto di covarianza, che deriva il suo nome dalla parentela con la formula della varianza: al posto del quadrato dello scarto di una variabile si prende il prodotto dei due scarti:

    V(X) = M( (X–M(X))2 )

    V(Y) = M( (Y–M(Y))2)   covarianza:   Cov(X,Y) = M( (X–M(X))(Y–M(Y)) )

    Nel caso sperimentale questo termine si traduce in: Σi (Xi–Mn(X))(Yi–Mn(Y)) / n

    La formula può essere motivata in vari modi. Ad es. si può interpretarla come un indicatore che assume un valore assoluto che scende quanto più i punti tendono a disporsi in modo da presentare una simmetria verticale o orizzontale e che cresce quanto più i punti tendono a disporsi lungo una retta obliqua. Infatti le componenti della sommatoria rappresentano aree "con segno" di rettangolini che hanno come dimensioni le distanze "con segno" delle coordinate dei punti dalle coordinate del baricentro. Nella figura sotto a sinistra (simmetria orizzontale) le componenti della sommatoria due a due si annullano, per cui la covarianza è nulla. Se schiaccio obliquamente la nuvola di punti la compensazione diventa solo parziale. Nella caso della figura a destra (X e Y in relazione lineare) non c'è alcuna compensazione (componenti tutte positive).

    Il segno sarà uguale al segno della pendenza della retta lungo cui i punti tendono a disporsi.

    Se X e Y sono indipendenti, ci aspettiamo che la covarianza sia nulla. E infatti:
            Cov(X,Y) = M((X–M(X)))M((Y–M(Y))) = 0·0 = 0.

    L'interpretazione geometrica ci facilita la comprensione che M( (X–M(X))(Y–M(Y)) ) è 0 anche nel caso in cui fissando diversi valori di X la Y continua a variare in modo "analogo" attorno sempre allo stesso valor medio, e, viceversa, fissando … . Cioè se all'aumentare di una delle due variabili l'altra non tende a modificarsi. Ovviamente, una persona "allenata" può capire ciò direttamente dalla formula.

    Un'altra possibile interpretazione è basata sull'osservazione che Cov(X,Y) = M(X·Y)–M(X)·M(Y): la covarianza è un indicatore dello scarto di M(X·Y) da M(X)·M(Y), cioè dal valore che M(X·Y) assumerebbe nel caso della indipendenza.

    Per non tener conto delle unità di misura in cui sono espressi X e Y (e per passare da un'"area" a un numero puro) la covarianza viene normalizzata dividendo per gli s.q.m. di X e Y, introducendo il:

coefficiente di correlazione:  rX,Y 
Cov(X,Y)
—————
√(V(X) V(Y))
 = 
Cov(X,Y)
—————
σ(X)σ(Y)

    L'interpretazione geometrica con cui abbiamo introdotto la covarianza fa supporre che se X e Y sono dipendenti deterministicamente e legate da una relazione lineare  Y = aX + b  il coefficiente di correlazione assuma valore assoluto massimo. Ciò può effettivamente essere dimostrato (la dimostrazione non è complicata, ma la omettiamo).
    Si ricava facilmente, usando le proprietà della media, che in questo caso rX,Y = sgn(a) [sgn(a)=1 se a>0, sgn(a)=–1 se a<0].
    Quindi in generale  –1≤rX,Y≤1.

Nota. Nel caso di un sistema di due variabili gaussiane l'indipendenza e la non correlazione sono equivalenti: corrispondono a superfici di densità con curve di livello ellittiche ad assi orizzontali e verticali.

<<<     Paragrafo precedente Paragrafo successivo     >>>