Il Teorema di Gauss-Markov stabilisce le ipotesi che un estimatore OLS (Ordinary Least Squares) deve soddisfare per essere considerato ELIO (Optimal Unbiased Linear Estimator). Il teorema di Gauss-Markov è stato formulato da Carl Friederich Gauss e Andrei Markov
Carl Friederich Gauss e Andrei Markov hanno ipotizzato che un estimatore MCO potrebbe essere ELIO.
Se queste 5 ipotesi sono soddisfatte, possiamo dire che lo stimatore è quello con la più bassa (precisa) varianza tra tutti gli stimatori lineari e imparziali. Nel caso in cui una qualsiasi delle ipotesi delle prime tre (Linearità, Rigida Mezza Esogeneità Nulla o Non Perfetta Multicollinearità) fallisca, lo stimatore MCO non è più imparziale. Se solo 4 o 5 falliscono (Omocedasticità e Non autocorrelazione) lo stimatore rimane lineare e imparziale ma non è più il più preciso. In sintesi, il Teorema di Gauss-Markov afferma che:
- Nelle ipotesi 1, 2 e 3 lo stimatore del MCO è lineare e imparziale. Tuttavia, non sempre le prime tre ipotesi sono soddisfatte e lo stimatore non è imparziale. Affinché anche lo stimatore sia coerente, dobbiamo avere un campione ampio, più grande è, meglio è.
- Nelle ipotesi 1, 2, 3, 4 e 5 lo stimatore del MCO è lineare, imparziale e ottimale. Cioè, è un ottimo stimatore lineare imparziale (ELIO).
Ipotesi del teorema di Gauss-Markov
In particolare, ci sono 5 ipotesi:
1. Modello lineare nei parametri
E’ un’ipotesi piuttosto flessibile. Permette l’utilizzo delle funzioni delle variabili di interesse.
2. Media nulla e stretta esogeneità
Ciò implica che il valore medio dell’errore condizionato alle spiegazioni, è uguale al valore atteso non condizionato e vale zero. Inoltre, una rigorosa esogeneità richiede che gli errori del modello non siano correlati ad alcuna osservazione.
Mezzo zero:
Rigorosa esogeneità:
La metà nulla e la rigorosa esogeneità falliscono nel caso in cui si verifichi:
- Il modello è mal specificato (omissione di variabili rilevanti, per esempio)
- Ci sono errori di misura nelle variabili (i dati non sono stati rivisti)
- Nelle serie temporali, l’esogeneità rigorosa fallisce nei modelli endogeni ritardati (anche se può esistere un’esogeneità contemporanea) e nei casi in cui esistono effetti di feedback.
Nei dati trasversali è molto più facile ottenere l’ipotesi di esogeneità che nel caso di serie temporali.
3. Non c’è una multicollinearità esatta
Nel campione, nessuna delle variabili esplicative è costante. Non esistono relazioni lineari esatte tra le variabili esplicative. Non esclude alcune (non perfette) correlazioni tra le variabili. Secondo Gauss e Markov, quando un modello ha un’esatta multicollinearità è solitamente dovuto ad un errore dell’analista.
4. Omocedasticità
La varianza dell’errore e, quindi, di Y è indipendente dai valori delle spiegazioni e, inoltre, dalla varianza dell’errore costante. Matematicamente si esprime come:
Di seguito una serie di dati dall’aspetto omofobico.
5. Nessuna autocorrelazione
I termini di errore di due diverse osservazioni condizionate a X non sono correlati. Se il campione è casuale non ci sarà autocorrelazione.
Dove i deve avere un valore diverso da h. Se il campione è casuale, i dati e gli errori di osservazione “i” e “h” saranno indipendenti per qualsiasi coppia di osservazioni “i” e “h”.