Interazione tra variabili binarie indipendenti

Sommario:

Anonim

L'interazione tra variabili indipendenti in una regressione multipla si verifica quando l'effetto parziale sulla variabile dipendente di una variabile indipendente dipende da un'altra variabile indipendente della regressione.

In altre parole, vogliamo quantificare la relazione di dipendenza tra variabili indipendenti quando una di esse influenza parzialmente la variabile dipendente del modello.

Il punto di partenza è una regressione multipla.

Procedura ed esempio

Vogliamo studiare il prezzo di skipass(skipassio) a seconda della qualità della neve (neveio) e il livello degli sciatori (livelloio). Tratteremo queste variabili qualitative come variabili dummy o binarie. Vale a dire:

neveio = ottima qualità della neve => neveio=1.

neveio = qualità della neve molto scarsa => neveio=0.

livelloio = livello di sciatori alto => livelloio=1.

livelloio = livello di sciatori basso => ​​livelloio=0.

Poi,

Modello 1

H.H1 = è l'effetto parziale di un'ottima qualità della neve (neveio= 1) su log (skipassio), mantenendo costante il livello degli sciatori (livelloio).

H.H2 = è l'effetto parziale dell'alto livello degli sciatori (livelloio= 1) su log (skipassio), mantenendo costante la qualità della neve (neveio).

Il modello 1 ha un'importante limitazione: mantenere costante una delle variabili dummy del modello implica che:

livelloio= costante => Non distinguiamo tra alto livello (livelloio= 1) o basso (livelloio=0).

neveio= costante => Non distinguiamo tra qualità molto buona (neveio= 1) o molto male (neveio=0).

Al di là di questa limitazione, possiamo modificare la regressione in modo che ci sia un'interazione (dipendenza) tra variabili indipendenti che possa differenziare entrambi i valori che assume la variabile indipendente costante.

Matematicamente, si può dare che l'effetto parziale di neveio circa il registro (skipassio) mantenendo livelloio costante dipende dal valore che assume livelloio. In caso di livelloio può essere che l'effetto parziale di livelloiocirca il registro (skipassio) mantenendo neveio costante dipende dal valore che assume neveio.

schematicamente

Se c'è un'interazione tralivelloioneveio, cosi quandolivelloio è costante possiamo distinguere tra livello alto o basso. In questo modo il prezzo diskipass quando la qualità della neve è molto buona (neveio= 1) sarà diverso a seconda che il livello degli sciatori sia alto o basso.

Se c'è un'interazione tralivelloioneveioquindi quando nevicaioè costante che possiamo distinguere tra neve molto buona o molto cattiva. In questo modo il prezzo diskipassquando il livello degli sciatori è alto (livelloio= 1) sarà diverso a seconda che la neve sia molto buona o pessima.

Come traduciamo questa interazione in regressione? Incorporando il termine di interazione.

Il termine di interazione è:

(neveio · livelloio )

Questa nuova regressione che incorpora sia le variabili binarie indipendenti che il termine di interazione è chiamata modello di regressione dell'interazione delle variabili binarie.