Modello di probabilità lineare

Sommario:

Anonim

Il modello di probabilità lineare è un modello di scelta binaria. In questo, l'aspettativa condizionale della variabile dipendente è una funzione lineare, cioè la relazione della variabile dipendente con la variabile esplicativa (s) è costante.

Per vederlo in un altro modo, il modello di probabilità lineare è un modello in cui abbiamo una variabile dipendente e una variabile indipendente moltiplicata per un coefficiente permanente.

Dobbiamo precisare che il modello di probabilità lineare è un modello di scelta binaria, cioè dove la variabile dipendente può assumere due valori. Questi valori sono 1 o 0, per indicare rispettivamente il successo o il fallimento.

Il modello di probabilità lineare è espresso come segue:

E (Y | X = x) = Pr (Y = 1 | X = x) = p (x) = β0 + β1x

Nell'equazione mostrata, l'aspettativa condizionata di Y dato X è interpretata come uguale a 0 + β1x.

In questo caso, prendiamo l'aspettativa condizionata, poiché ci interessa conoscere la probabilità che un individuo prenda una decisione date le sue caratteristiche, ad esempio (o un'altra variabile indipendente può essere presa come riferimento).

Svantaggi del modello di probabilità lineare

Alcuni svantaggi del modello di probabilità lineare sono i seguenti:

  • Il modello di probabilità lineare può mostrare eteroschedasticità. Vale a dire, la varianza degli errori non è la stessa in tutte le osservazioni fatte. In tal caso, vengono utilizzati gli errori standard.
  • Non si può presumere che gli errori siano distribuiti normalmente.
  • La variabile dipendente può assumere solo due valori.
  • Si assume che le variabili indipendenti e dipendenti abbiano una relazione lineare, ovvero che il tasso di variazione sia sempre lo stesso. Tuttavia, potrebbe essere più accurato costruire un modello in cui il tasso di variazione aumenta quando Y raggiunge un valore più alto e il contrario accade quando Y diminuisce.

Dati questi inconvenienti, esistono i modelli logit e probit.

Esempio di un modello di probabilità lineare

È possibile costruire un modello di probabilità lineare, ad esempio, in cui la variabile dipendente indica se la persona ha attualmente o meno un lavoro formale che ha svolto per un anno o più. Le variabili indipendenti potrebbero essere il livello di studi o di istruzione, il sesso e l'età.

Nell'esempio mostrato, la variabile dipendente sarà 1 o 0, ma deve essere interpretata qualitativamente, indipendentemente dal suo valore numerico. Pertanto, 1 significa che la persona ha un lavoro formale che è stato mantenuto per più di 1 anno e 0 sarebbe la situazione in cui ciò non si verifica.