La correlazione, nota anche come coefficiente di correlazione lineare (di Pearson), è una misura di regressione che mira a quantificare il grado di variazione congiunta tra due variabili.
Si tratta quindi di una misura statistica che quantifica la dipendenza lineare tra due variabili, cioè se i valori che prendono due variabili sono rappresentati in un diagramma di dispersione, il coefficiente di correlazione lineare indicherà quanto bene o quanto male l’insieme dei punti rappresentati si avvicina ad una linea.
In modo meno colloquiale, possiamo definirlo come il numero che misura il grado di intensità e la direzione del rapporto tra due variabili.
Essere:
Cov (x;y): la covarianza tra il valore “x” e “y”.
σ(x): deviazione standard di “x
σ(y): deviazione standard di “y”.
Valori che la correlazione può assumere
ρ = -1 Perfetta correlazione negativa
ρ = 0 Nessuna correlazione
ρ = +1 Correlazione positiva perfetta
Si parla di correlazione positiva se ogni volta che il valore “x” sale, il valore “y” sale, e anche con la stessa intensità (+1).
Nel caso opposto, se ogni volta che il valore “x” sale, e il valore “y” scende, e anche con la stessa intensità, allora stiamo parlando di correlazione negativa (-1).
È importante sapere che questo non significa che lo facciano nella stessa proporzione (a meno che non abbiano la stessa deviazione standard).
Rappresentazione grafica della correlazione
Perfetta correlazione positiva:
Non c’è alcuna correlazione:
Perfetta correlazione negativa:
Suggerimento: In molte occasioni non abbiamo i mezzi o i dati per utilizzare questa formula. Pertanto, se abbiamo due serie di prezzi, possiamo calcolare il coefficiente di correlazione in Excel, utilizzando la seguente funzione: coef.de.correl (serie di prezzi x;serie di prezzi y).