Coefficiente di correlazione lineare

Sommario:

Anonim

La correlazione, nota anche come coefficiente di correlazione lineare (Pearson), è una misura di regressione che tenta di quantificare il grado di variazione congiunta tra due variabili.

Pertanto, è una misura statistica che quantifica la dipendenza lineare tra due variabili, cioè se i valori assunti da due variabili sono rappresentati in un diagramma di dispersione, il coefficiente di correlazione lineare indicherà quanto buono o cattivo l'insieme di punti rappresentato si avvicina a una linea.

In modo meno colloquiale, possiamo definirlo come il numero che misura il grado di intensità e il senso della relazione tra due variabili.

Essere:

Cov (x; y): il covarianza tra il valore "x" e "y".

(x): deviazione standard di "x".

(y): deviazione standard di "y".

Valori che la correlazione può assumere

ρ = -1 Correlazione perfetta negativa

ρ = 0 Non c'è correlazione

ρ = +1 correlazione perfetta positiva

Si parla di correlazione positiva se ogni volta che il valore "x" sale, il valore "y" sale, e anche con la stessa intensità (+1).

Nel caso opposto, se ogni volta che il valore "x" aumenta e il valore "y" scende, e anche con la stessa intensità, allora si parla di correlazione negativa (-1).

È importante sapere che questo non significa che lo facciano nella stessa proporzione (a meno che non abbiano la stessa deviazione standard).

Analisi di regressione

Rappresentazione grafica della correlazione

Correlazione perfetta positiva:

Non c'è correlazione:

Correlazione perfetta negativa:

Suggerimento: in molte occasioni non abbiamo i mezzi o i dati per utilizzare questa formula. Pertanto, se abbiamo due serie di prezzi, possiamo calcolare il coefficiente di correlazione in excel, utilizzando la seguente funzione: coef.de.correl (serie di prezzi x; serie di prezzi y).

r quadrato o coefficiente di determinazionecoefficiente di variazione