▷ Teorema di Gauss-Márkov: Che cos’è, definizione e concetto 【2024】

Il Teorema di Gauss-Markov stabilisce le ipotesi che un estimatore OLS (Ordinary Least Squares) deve soddisfare per essere considerato ELIO (Optimal Unbiased Linear Estimator). Il teorema di Gauss-Markov è stato formulato da Carl Friederich Gauss e Andrei Markov

Carl Friederich Gauss e Andrei Markov hanno ipotizzato che un estimatore MCO potrebbe essere ELIO.

Se queste 5 ipotesi sono soddisfatte, possiamo dire che lo stimatore è quello con la più bassa (precisa) varianza tra tutti gli stimatori lineari e imparziali. Nel caso in cui una qualsiasi delle ipotesi delle prime tre (Linearità, Rigida Mezza Esogeneità Nulla o Non Perfetta Multicollinearità) fallisca, lo stimatore MCO non è più imparziale. Se solo 4 o 5 falliscono (Omocedasticità e Non autocorrelazione) lo stimatore rimane lineare e imparziale ma non è più il più preciso. In sintesi, il Teorema di Gauss-Markov afferma che:

Nelle ipotesi 1, 2 e 3 lo stimatore del MCO è lineare e imparziale. Tuttavia, non sempre le prime tre ipotesi sono soddisfatte e lo stimatore non è imparziale. Affinché anche lo stimatore sia coerente, dobbiamo avere un campione ampio, più grande è, meglio è.
Nelle ipotesi 1, 2, 3, 4 e 5 lo stimatore del MCO è lineare, imparziale e ottimale. Cioè, è un ottimo stimatore lineare imparziale (ELIO).

Ipotesi del teorema di Gauss-Markov

In particolare, ci sono 5 ipotesi:

1. Modello lineare nei parametri

E’ un’ipotesi piuttosto flessibile. Permette l’utilizzo delle funzioni delle variabili di interesse.

2. Media nulla e stretta esogeneità

Ciò implica che il valore medio dell’errore condizionato alle spiegazioni, è uguale al valore atteso non condizionato e vale zero. Inoltre, una rigorosa esogeneità richiede che gli errori del modello non siano correlati ad alcuna osservazione.

Mezzo zero:

Rigorosa esogeneità:

La metà nulla e la rigorosa esogeneità falliscono nel caso in cui si verifichi:

Il modello è mal specificato (omissione di variabili rilevanti, per esempio)
Ci sono errori di misura nelle variabili (i dati non sono stati rivisti)
Nelle serie temporali, l’esogeneità rigorosa fallisce nei modelli endogeni ritardati (anche se può esistere un’esogeneità contemporanea) e nei casi in cui esistono effetti di feedback.

Nei dati trasversali è molto più facile ottenere l’ipotesi di esogeneità che nel caso di serie temporali.

3. Non c’è una multicollinearità esatta

Nel campione, nessuna delle variabili esplicative è costante. Non esistono relazioni lineari esatte tra le variabili esplicative. Non esclude alcune (non perfette) correlazioni tra le variabili. Secondo Gauss e Markov, quando un modello ha un’esatta multicollinearità è solitamente dovuto ad un errore dell’analista.

4. Omocedasticità

La varianza dell’errore e, quindi, di Y è indipendente dai valori delle spiegazioni e, inoltre, dalla varianza dell’errore costante. Matematicamente si esprime come:

Di seguito una serie di dati dall’aspetto omofobico.

5. Nessuna autocorrelazione

I termini di errore di due diverse osservazioni condizionate a X non sono correlati. Se il campione è casuale non ci sarà autocorrelazione.

Dove i deve avere un valore diverso da h. Se il campione è casuale, i dati e gli errori di osservazione “i” e “h” saranno indipendenti per qualsiasi coppia di osservazioni “i” e “h”.