R quadrato rettificato (coefficiente di determinazione corretto)

Sommario:

R quadrato rettificato (coefficiente di determinazione corretto)
R quadrato rettificato (coefficiente di determinazione corretto)
Anonim

L'R al quadrato aggiustato (o coefficiente di determinazione aggiustato) è usato nella regressione multipla per vedere il grado di intensità o efficacia delle variabili indipendenti nello spiegare la variabile dipendente.

In parole più semplici, l'R-quadrato corretto ci dice quale percentuale della variazione della variabile dipendente è spiegata collettivamente da tutte le variabili indipendenti.

L'uso di questo coefficiente è giustificato dal fatto che quando aggiungiamo variabili a una regressione, il coefficiente di determinazione non aggiustato tende ad aumentare. Anche quando il contributo marginale di ciascuna delle nuove variabili aggiunte non ha rilevanza statistica.

Quindi, aggiungendo delle variabili al modello, il coefficiente di determinazione potrebbe aumentare e si potrebbe pensare, erroneamente, che l'insieme di variabili scelto sia in grado di spiegare una parte maggiore della variazione della variabile indipendente. Questo problema è comunemente noto come "sovrastima del modello".

Coefficiente di variazioneAnalisi di regressione

Coefficiente di determinazione corretto formula

Per risolvere il problema sopra descritto, molti ricercatori suggeriscono di regolare il coefficiente di determinazione utilizzando la seguente formula:

R2 per → R al quadrato corretto o coefficiente di determinazione corretto

R2 → R quadrato o coefficiente di determinazione

n → Numero di osservazioni nel campione

K → Numero di variabili indipendenti

Considerando che 1-R2 è un numero costante e poiché n è maggiore di k, man mano che aggiungiamo variabili al modello, il quoziente tra parentesi diventa maggiore. Di conseguenza. anche il risultato della moltiplicazione per 1-R2 . Con cui vediamo che la formula è costruita per aggiustare e penalizzare l'inclusione dei coefficienti nel modello.

Oltre al vantaggio precedente, l'aggiustamento utilizzato nella formula precedente consente anche di confrontare modelli con numeri diversi di variabili indipendenti. Anche in questo caso, la formula aggiusta il numero di variabili tra un modello e l'altro e ci permette di fare un confronto omogeneo.

Tornando alla formula precedente, possiamo dedurre che il coefficiente di determinazione rettificato sarà sempre uguale o inferiore al coefficiente di R2. A differenza del coefficiente di determinazione che varia tra 0 e 1, il coefficiente di determinazione rettificato potrebbe essere negativo per 2 motivi:

  • Il k più vicino si avvicina a n.
  • Più basso è il coefficiente di determinazione.
Coefficiente di correlazione lineare