Estimativa com variáveis ​​instrumentais (VI)

Índice:

Anonim

O método das Variáveis ​​Instrumentais (VI) é usado para resolver o problema de endogeneidade de uma ou mais variáveis ​​independentes em uma regressão linear.

O aparecimento de endogeneidade em uma variável indica que essa variável está correlacionada com o termo de erro. Em outras palavras, uma variável que está correlacionada com as outras foi omitida. Estamos falando de variáveis ​​explicativas que apresentam correlação com o termo de erro. Outro método muito popular para resolver o problema de endogeneidade é o Estimador de Mínimos Quadrados de Dois Estágios (LS2E). A principal função do VI é detectar a presença de uma variável explicativa no termo de erro.

Introdução ao conceito

Queremos estudar a variação de preços de passes de esqui dependendo do número de pistas e da aversão ao risco dos esquiadores refletida na qualidade do seguro. Ambas as variáveis ​​explicativas são variáveis ​​quantitativas.

Assumimos que incluímos a variável seguro no termo de erro (u), resultando em:

Então, a variável seguro torna-se uma variável explicativa endógena porque pertence ao termo de erro e, portanto, está correlacionada com ele. Como removemos uma variável explicativa, também removemos seu regressor, neste caso, B2.

Se tivéssemos estimado este modelo com Mínimos Quadrados Ordinários (OLS), teríamos obtido uma estimativa inconsistente e enviesada para B0 e Bk.

Podemos usar o Modelo 1.A se encontrarmos uma variável instrumental (z) a fim de trilhas cumprindo:

  • Cov (z, ou) = 0 => z não está correlacionado com ou.
  • Cov (z, trilhas) ≠ 0 => z sim, está correlacionado com trilhas.

Essa variável instrumental (z) é exógena ao Modelo 1 e, portanto, não tem efeito parcial no log (forfaits). Ainda assim, é relevante explicar a variação nas faixas.

Contraste de hipótese

Para saber se a variável instrumental (z) está estatisticamente correlacionada com a variável explicativa (pistas), podemos testar a condição Cov (z, pistas) ≠ 0 dada uma amostra aleatória da população. Para isso temos que fazer a regressão entre trilhas Y z. Usamos uma nomenclatura diferente para diferenciar em quais variáveis ​​estão sendo retornadas.

Nós interpretamos o π0 Y πk da mesma forma que o B0 e Bk em regressões convencionais.

Nós entendemos π1 = Cov (z, faixas) / Var (z)

  1. Definição da hipótese

Neste contraste, queremos testar se ele pode ser rejeitado π1 = 0 a um nível de significância suficientemente pequeno (5%). Portanto, se a variável instrumental (z) está correlacionada com a variável explicativa (pistas) e ser capaz de rejeitar H0.

2. Estatística de contraste

3. Regra de rejeição

Determinamos o nível de significância em 5%. Portanto, nossa regra de rejeição será baseada em | t | > 1,96.

  • | t | > 1,96: rejeitamos H0. Ou seja, não rejeitamos nenhuma correlação entre z e faixas.
  • | t | <1,96: não temos evidências significativas o suficiente para rejeitar H0. Ou seja, não rejeitamos que não haja correlação entre z e faixas.

4. Conclusão

Se concluirmos que π1 = 0, estatisticamente a variável instrumental (z) não é uma boa aproximação para a variável endógena.