Stima con variabili strumentali (VI)

Sommario:

Anonim

Il metodo delle variabili strumentali (VI) viene utilizzato per risolvere il problema dell'endogeneità di una o più variabili indipendenti in una regressione lineare.

La comparsa di endogeneità in una variabile indica che questa variabile è correlata con il termine di errore. In altre parole, è stata omessa una variabile correlata alle altre. Si tratta di variabili esplicative che mostrano una correlazione con il termine di errore. Un altro metodo molto popolare per risolvere il problema dell'endogeneità è lo stimatore dei minimi quadrati a due stadi (LS2E). La funzione principale di VI è quella di rilevare la presenza di una variabile esplicativa nel termine di errore.

Introduzione al concetto

Vogliamo studiare la variazione dei prezzi di skipass a seconda del numero di piste e dell'avversione al rischio degli sciatori che si riflette nella qualità dell'assicurazione. Entrambe le variabili esplicative sono variabili quantitative.

Supponiamo di includere la variabile assicurazione nel termine di errore (u), risultando in:

Quindi, la variabile assicurativa diventa una variabile esplicativa endogena perché appartiene al termine di errore e, quindi, è correlata ad esso. Poiché rimuoviamo una variabile esplicativa, rimuoviamo anche il suo regressore, in questo caso B2.

Se avessimo stimato questo modello con Ordinary Least Squares (OLS), avremmo ottenuto una stima inconsistente e distorta per B0 e BK.

Possiamo usare il Modello 1.A se troviamo una variabile strumentale (z) in modo da brani adempimento:

  • Cov (z, o) = 0 => z non è correlato con o.
  • Cov (z, brani) ≠ 0 => z si è correlato con brani.

Questa variabile strumentale (z) è esogena al Modello 1 e, quindi, non ha effetto parziale sul log (forfait). Tuttavia, è rilevante spiegare la variazione nelle tracce.

Ipotesi contrasto

Per sapere se la variabile strumentale (z) è statisticamente correlata con la variabile esplicativa (indizi), possiamo testare la condizione Cov (z, indizi) ≠ 0 dato un campione casuale della popolazione. Per questo dobbiamo fare la regressione tra braniz. Usiamo una nomenclatura diversa per differenziare su quali variabili vengono restituite.

Interpretiamo il π0πK allo stesso modo del B0 e BK nelle regressioni convenzionali.

Comprendiamo π1 = Cov (z, tracce) / Var (z)

  1. Definizione dell'ipotesi

In questo contrasto vogliamo verificare se può essere rifiutato π1 = 0 ad un livello di significatività sufficientemente piccolo (5%). Pertanto, se la variabile strumentale (z) è correlata con la variabile esplicativa (indizi) e poter rifiutare H0.

2. Statistica del contrasto

3. Regola di rifiuto

Determiniamo il livello di significatività al 5%. Pertanto, la nostra regola di rifiuto sarà basata su | t | > 1.96.

  • | t | > 1.96: rifiutiamo H0. Cioè, non rifiutiamo alcuna correlazione tra ze tracce.
  • | t | <1.96: non abbiamo prove sufficienti per rifiutare H0. Cioè, non rifiutiamo che non ci sia correlazione tra z e tracce.

4. Conclusione

Se concludiamo che π1 = 0, statisticamente la variabile strumentale (z) non è una buona approssimazione per la variabile endogena.