I modelli a scelta binaria sono modelli in cui la variabile dipendente assume solo due valori: 1 per indicare "successo" o "0" per indicare un fallimento. I modelli concreti di stima sono: probabilità lineare, logit e probit.
Nel modello di regressione semplice o multipla che viene insegnato nel corso introduttivo di Econometria, la variabile dipendente di solito ha un'interpretazione economica (come l'aumento del PIL, degli investimenti o dei consumi) da altre variabili esplicative.
Ma quale modello usiamo quando vogliamo spiegare eventi che hanno solo due possibilità? Ad esempio: superare o non superare la materia, laurearsi o non laurearsi, essere occupati o disoccupati, ecc. Questo è ciò a cui rispondono i modelli di scelta binaria.
In ognuno di questi casi puoi fare sì = 1 denota "successo"; sì = 0 denota "fallimento". Per questo motivo vengono chiamati modelli di scelta binaria e l'equazione che utilizza è così:
In questo modo otterremo la probabilità di successo di una certa variabile.
Finora non ha grosse complicazioni. Tuttavia, la stima e l'interpretazione dei parametri richiede maggiore attenzione.
Modello di regressioneModelli per la stima dei parametri binari
Date le suddette caratteristiche della variabile indipendente, esistono tre modelli di stima dei parametri:
- Modello di probabilità lineare. Viene calcolato tramite il normale OLS.
- Modello Logit. Viene calcolato con una funzione di distribuzione logistica standard.
- Modello Probit. Viene calcolato con una funzione di distribuzione normale standard.
Modello di probabilità lineare
Il modello di probabilità lineare (MPL) è così chiamato perché la probabilità
la risposta è lineare rispetto ai parametri dell'equazione. Per la stima utilizzare i minimi quadrati ordinari (OLS)
L'equazione stimata è scritta
La variabile indipendente (e cappello) è la probabilità di successo prevista.
il B0 cap è la probabilità di successo prevista quando ciascuna delle x è uguale a zero. Il coefficiente B1 cap misura la variazione della probabilità di successo prevista quando x1 aumenta di una unità.Per interpretare correttamente un modello di probabilità lineare, dobbiamo tenere conto di cosa è considerato un successo e cosa no.
Esempio di modello di scelta binaria
L'economista Jeffrey Wooldridge ha stimato un modello econometrico in cui la variabile binaria indica se una donna sposata ha partecipato alla forza lavoro (variabile spiegata) durante il 1975. In questo caso sì = 1 significa che e ha partecipato sì = 0 che non lo ha fatto.
Il modello utilizza il livello di reddito del marito come variabili esplicative (ciao), anni di istruzione (educare), anni di esperienza nel mercato del lavoro (esperto), età (età), il numero di bambini di età inferiore a sei anni (bambinilt6) e il numero di bambini tra i 6 e i 18 anni (kidsge6).
Possiamo verificare che tutte le variabili tranne kidsge6 sono statisticamente significative e tutte le variabili significative hanno l'effetto atteso.
Ora, l'interpretazione dei parametri è così:
- Se aumenti un anno di istruzione, ceteris paribus, la probabilità di entrare nel mondo del lavoro aumenta del 3,8%.
- Se l'esperienza aumenta in un anno, la probabilità di far parte della forza lavoro aumenta del 3,9%.
- Se hai un figlio di età inferiore ai 6 anni, ceteris paribus, la probabilità di entrare a far parte della forza lavoro si riduce del 26,2%.
Quindi, vediamo che questo modello ci dice l'effetto di ogni situazione sulla probabilità che una donna sia formalmente assunta.
Questo modello può essere utilizzato per valutare politiche pubbliche e programmi sociali, poiché la variazione della “probabilità di successo prevista” può essere quantificata rispetto a variazioni unitarie o marginali delle variabili esplicative.
Svantaggi del modello di probabilità lineare
Tuttavia, questo modello presenta due principali svantaggi:
- Può dare probabilità inferiori a zero e maggiori di uno, il che non ha senso in termini di interpretazione di tali valori.
- Gli effetti parziali sono sempre costanti. In questo modello non c'è differenza tra passare da zero figli a un figlio, che passare da due a tre figli.
- Poiché la variabile esplicativa assume solo valori pari a zero o uno, è possibile generare eteroschedasticità. Gli errori standard vengono utilizzati per risolvere questo problema.
Per risolvere i primi due problemi, che sono i più importanti nel modello di probabilità lineare, sono stati progettati i modelli Logit e Probit.
Riferimenti:
Wooldridge, J. (2010) Introduzione all'econometria. (4a ed.) Messico: Cengage Learning.