La correlazione, nota anche come coefficiente di correlazione lineare (Pearson), è una misura di regressione che tenta di quantificare il grado di variazione congiunta tra due variabili.
Pertanto, è una misura statistica che quantifica la dipendenza lineare tra due variabili, cioè se i valori assunti da due variabili sono rappresentati in un diagramma di dispersione, il coefficiente di correlazione lineare indicherà quanto buono o cattivo l'insieme di punti rappresentato si avvicina a una linea.
In modo meno colloquiale, possiamo definirlo come il numero che misura il grado di intensità e il senso della relazione tra due variabili.
Essere:
Cov (x; y): il covarianza tra il valore "x" e "y".
(x): deviazione standard di "x".
(y): deviazione standard di "y".
Valori che la correlazione può assumere
ρ = -1 Correlazione perfetta negativa
ρ = 0 Non c'è correlazione
ρ = +1 correlazione perfetta positiva
Si parla di correlazione positiva se ogni volta che il valore "x" sale, il valore "y" sale, e anche con la stessa intensità (+1).
Nel caso opposto, se ogni volta che il valore "x" aumenta e il valore "y" scende, e anche con la stessa intensità, allora si parla di correlazione negativa (-1).
È importante sapere che questo non significa che lo facciano nella stessa proporzione (a meno che non abbiano la stessa deviazione standard).
Analisi di regressioneRappresentazione grafica della correlazione
Correlazione perfetta positiva:
Non c'è correlazione:
Correlazione perfetta negativa:
Suggerimento: in molte occasioni non abbiamo i mezzi o i dati per utilizzare questa formula. Pertanto, se abbiamo due serie di prezzi, possiamo calcolare il coefficiente di correlazione in excel, utilizzando la seguente funzione: coef.de.correl (serie di prezzi x; serie di prezzi y).
r quadrato o coefficiente di determinazionecoefficiente di variazione