La covarianza è il valore che riflette l’ammontare di cui due variabili casuali variano insieme rispetto ai loro mezzi.
Ci permette di sapere come si comporta una variabile in funzione di ciò che fa un’altra variabile. Cioè, quando X sale, come si comporta Y? Quindi, la covarianza può assumere i seguenti valori:
La covarianza (X,Y) è inferiore a zero quando “X” sale e “Y” scende. C’è un rapporto negativo.
La covarianza (X,Y) è maggiore di zero quando “X” sale e “Y” sale. C’è un rapporto positivo.
La covarianza (X,Y) è uguale a zero quando non c’è relazione tra le variabili “X” e “Y”.
Calcolo della covarianza
La formula di covarianza è espressa come segue:
Dove y con l’accento è la media della variabile Y, e x con l’accento è la media della variabile X. “i” è la posizione dell’osservazione e “n” è il numero totale di osservazioni.
Proprietà di Covarianza
Quando si lavora con esso, dobbiamo tenere conto delle proprietà che ha e che si deducono dalla definizione della covarianza stessa:
- Cov (X, b) = 0, con b come costante in questo caso.
- Cov (X, X) = Var(X), cioè la covarianza di una variabile ed essa stessa è uguale alla varianza della variabile.
- Cov (X, Y) = Cov(Y,X) la covarianza è la stessa, indipendentemente dall’ordine in cui le mettiamo.
- Cov (b-X, c-Y) = c-b -Cov(X,Y) dove b e c sono due costanti. La covarianza di due variabili moltiplicata per due costanti qualsiasi è uguale alla covarianza delle due variabili moltiplicata per la moltiplicazione delle costanti.
- Cov (b+X, c+Y) = Cov(X,Y) aggiungendo due costanti qualsiasi a ciascuna variabile non influisce sulla covarianza.
- Cov (X,Y) = E(X-Y) – E(X)-E(Y) o quello che è lo stesso, la covarianza è uguale alla speranza del prodotto delle due variabili meno il prodotto delle due speranze separatamente.
Estendere le proprietà precedenti, nel caso in cui due variabili siano indipendenti Cioè, non hanno alcun rapporto statistico, questo è soddisfatto:
E(X-Y) = E(X)-E(Y)
In altre parole, la speranza del prodotto di due variabili è uguale al prodotto delle due speranze separate di quelle variabili.
Esempio di covarianza
Supponiamo di avere i seguenti dati di X e Y.
Come si interpreta questo 4?
Questo 4 ci dice, essendo maggiore di zero, che queste due variabili hanno un rapporto positivo. Per conoscere la relazione corretta tra le due variabili dovremmo calcolare la correlazione lineare. Due covarianze di variabili diverse non sono comparabili, poiché il valore della covarianza è un valore assoluto che dipende dall’unità di misura delle variabili.