Variável relevante omitida

Índice:

Anonim

A omissão de uma variável relevante é a não inclusão de uma variável explicativa importante em uma regressão. Dadas as premissas de Gauss-Markov, essa omissão causaria viés e inconsistência em nossas estimativas.

Em outras palavras, a omissão de uma variável relevante ocorre quando a incorporamos ao termo de erro u porque não a levamos em consideração. Isso fará com que exista uma correlação entre a variável dependente e o termo de erro u.

Matematicamente, assumimos que:

Cov (x, u) = 0

Se incorporarmos uma variável relevante no termo de erro ou, então:

Cov (x, u) ≠ 0

Dadas as suposições de Gauss-Markov, esta correlação:

(ρ (x, u) ≠ 0)

Não cumpriria isso:

E (u | x) = E (u) = 0

Ou seja, a expectativa dos erros condicionados aos explicativos é igual à expectativa do erro e que também é zero. Estas são as suposições de imparcialidade (exogeneidade estrita + média nula)

Nos casos de omissão da variável relevante, o estimador OLS é enviesado e torna-se inconsistente. Portanto, isso viola duas das propriedades do estimador e faz com que nossa estimativa esteja errada.

Exemplo teórico

Supomos que queremos estudar o número de esquiadores sazonais (t) levando em consideração vários fatores: o preço dos passes de esqui (passes de esqui) e o número de pistas abertas (pistas) e a qualidade da neve (neve).

Modelo 0

Assumimos que as variáveis ​​explicativas (passes de esqui, rampas e neve) são variáveis ​​relevantes para o Modelo 0 porque pertencem ao modelo populacional. Em outras palavras, as variáveis ​​explicativas de nosso Modelo 0 têm um efeito parcial na variável dependente esquiadores no modelo populacional. Então, tanto na população quanto nos modelos de amostra (Modelo 0) terão coeficientes diferentes de zero.

Interpretação

Um aumento na qualidade da neve (neve) e no número de pistas abertas (trilhas) causa um aumento nas estimativas de β2 e β3. Consequentemente, isso se reflete no número de esquiadores (esquiadores).

Um aumento percentual nos preços dos passes de esqui causa uma diminuição em β1/ 100 no número de esquiadores (esquiadores)

Processar

Tratamos a variável neve como uma variável omitida do modelo. Então:

Modelo 1

Diferenciamos o termo de erro u do Modelo 0 e o termo de erro v do Modelo 1 porque um não inclui a variável relevante neve e o outro inclui.

No Modelo 1, omitimos uma variável relevante do modelo e a introduzimos no termo de erro u. Isso significa que:

  • Cov (neve, v) ≠ 0 → ρ (neve, v) ≠ 0
  • E (v | neve) ≠ 0

Se omitirmos a variável neve relevante em nosso Modelo 1, faremos com que o estimador OLS apresente viés e inconsistência. Portanto, nossa estimativa do número de esquiadores sazonais estará errada. A estação de esqui pode estar com sérios problemas financeiros se você levar em consideração nossa estimativa do Modelo 1.