Il Teorema di Gauss-Markov è un insieme di assunzioni che uno stimatore OLS (Ordinary Least Squares) deve soddisfare per essere considerato ELIO (Optimal Linear Unbiased Estimator). EIl teorema di Gauss-Markov è stato formulato da Carl Friederich Gauss e Andrei Markov.
Carl Friederich Gauss e Andréi Márkov hanno stabilito alcune ipotesi in modo che uno stimatore OLS possa diventare ELIO.
Se queste 5 assunzioni sono soddisfatte, possiamo affermare che lo stimatore è quello con la varianza minima (più precisa) di tutti gli stimatori lineari e non distorti. Nel caso in cui una qualsiasi delle ipotesi dei primi tre fallisca (Linearità, Esogeneità media stretta nulla o Nessuna multicollinearità perfetta), lo stimatore OLS non è più imparziale. Se solo 4 o 5 falliscono (Omoschedasticità e Nessuna autocorrelazione) lo stimatore è ancora lineare e imparziale, ma non è più il più accurato. Riassumendo, il teorema di Gauss-Markov afferma che:
- Sotto le ipotesi 1, 2 e 3, lo stimatore OLS è lineare e imparziale. Ora, non fintanto che le prime tre ipotesi sono soddisfatte, si può garantire che lo stimatore sia imparziale. Affinché lo stimatore sia coerente, dobbiamo avere un campione ampio, più è e meglio è.
- Sotto le assunzioni 1, 2, 3, 4 e 5, lo stimatore OLS è lineare, imparziale e ottimo (ELIO).
Ipotesi del teorema di Gauss-Markov
Nello specifico ci sono 5 ipotesi:
1. Modello lineare nei parametri
È un'ipotesi abbastanza flessibile. Consente di utilizzare funzioni delle variabili di interesse.
2. Media nulla ed esogeneità rigorosa
Implica che il valore medio dell'errore condizionato alle spiegazioni è uguale al valore atteso incondizionato ed è uguale a zero. Inoltre, la rigorosa esogeneità richiede che gli errori del modello non siano correlati ad alcuna osservazione.
Nullo significa:
Esogeneità rigorosa:
La media nulla e l'esogeneità rigorosa falliscono se:
- Il modello è poco specificato (omissione di variabili rilevanti, per esempio).
- Ci sono errori di misurazione nelle variabili (i dati non sono stati rivisti).
- Nelle serie temporali, l'esogeneità rigida fallisce nei modelli di endogeneità ritardata (sebbene possa esistere esogeneità contemporanea) e nei casi in cui ci sono effetti di feedback.
Nei dati trasversali è molto più facile ottenere l'ipotesi di esogeneità che nel caso delle serie temporali.
3. Nessuna multicollinearità esatta
Nel campione nessuna delle variabili esplicative è costante. Non ci sono relazioni lineari esatte tra le variabili esplicative. Non esclude alcune correlazioni (non perfette) tra le variabili. Secondo Gauss e Markov, quando un modello ha una multicollinearità esatta, di solito è dovuto a un errore dell'analista.
4. Omoschedasticità
La varianza dell'errore, e quindi di Y, è indipendente dai valori esplicativi e, inoltre, dalla varianza dell'errore costante. Matematicamente si esprime come:
Ecco una serie di dati con aspetto omoschedastico.
5. Nessuna autocorrelazione
I termini di errore di due diverse osservazioni condizionate a X non sono correlati. Se il campione è casuale, non ci sarà autocorrelazione.
Dove devo avere un valore diverso da h. Se il campione è casuale, i dati e gli errori di osservazione "i" e "h" saranno indipendenti per ogni coppia di osservazioni "i" e "h".