O Teorema de Gauss-Markov é um conjunto de suposições que um estimador OLS (Ordinary Least Squares) deve cumprir para ser considerado ELIO (Optimal Linear Unbised Estimator). EO teorema de Gauss-Markov foi formulado por Carl Friederich Gauss e Andrei Markov.
Carl Friederich Gauss e Andréi Márkov estabeleceram algumas suposições para que um estimador OLS pudesse se tornar ELIO.
Se essas 5 premissas forem atendidas, podemos afirmar que o estimador é aquele com a variância mínima (mais precisa) de todos os estimadores lineares e não enviesados. No caso de qualquer uma das suposições das três primeiras falhar (Linearidade, Exogeneidade média estrita nula ou Sem multicolinearidade perfeita), o estimador OLS não é mais imparcial. Se apenas 4 ou 5 falharem (homocedasticidade e sem autocorrelação), o estimador ainda é linear e não enviesado, mas não é mais o mais preciso. Resumindo, o Teorema de Gauss-Markov afirma que:
- Nas hipóteses 1, 2 e 3, o estimador OLS é linear e não enviesado. Agora, não contanto que as três primeiras suposições sejam atendidas, pode-se garantir que o estimador seja imparcial. Para que o estimador seja consistente, devemos ter uma amostra grande, quanto mais, melhor.
- Nas hipóteses 1, 2, 3, 4 e 5, o estimador OLS é linear, não enviesado e ótimo (ELIO).
Suposições do teorema de Gauss-Markov
Especificamente, existem 5 suposições:
1. Modelo linear nos parâmetros
É uma suposição bastante flexível. Permite usar funções das variáveis de interesse.
2. Média nula e exogeneidade estrita
Isso implica que o valor médio do erro condicional às explicações é igual ao valor esperado incondicional e é igual a zero. Além disso, a exogeneidade estrita requer que os erros do modelo não sejam correlacionados com quaisquer observações.
Nulo significa:
Exogeneidade estrita:
Média nula e exogeneidade estrita falham se:
- O modelo é mal especificado (omissão de variáveis relevantes, por exemplo).
- Existem erros de medição nas variáveis (os dados não foram revisados).
- Em séries temporais, a exogeneidade estrita falha em modelos de endogeneidade atrasada (embora exogeneidade contemporânea possa existir) e nos casos em que há efeitos de feedback.
Em dados transversais, é muito mais fácil obter a suposição de exogeneidade do que no caso de séries temporais.
3. Sem multicolinearidade exata
Na amostra, nenhuma das variáveis explicativas é constante. Não há relações lineares exatas entre as variáveis explicativas. Não exclui alguma correlação (não perfeita) entre as variáveis. De acordo com Gauss e Markov, quando um modelo tem multicolinearidade exata, geralmente é devido a um erro do analista.
4. Homocedasticidade
A variância do erro e, portanto, de Y, é independente dos valores explicativos e, além disso, da variância do erro constante. Matematicamente, é expresso como:
Aqui está uma série de dados com aparência homocedástica.
5. Sem autocorrelação
Os termos de erro de duas observações diferentes condicionais a X não estão relacionados. Se a amostra for aleatória, não haverá autocorrelação.
Onde eu devo ter um valor diferente de h. Se a amostra for aleatória, os dados e os erros de observação "i" e "h" serão independentes para qualquer par de observações "i" e "h".