O método dos mínimos quadrados em dois estágios (LS2E) trata do problema da endogeneidade de uma ou mais variáveis explicativas em um modelo de regressão múltipla.
Seu principal objetivo é evitar que uma ou mais variáveis explicativas endógenas de um modelo sejam correlacionadas com o termo de erro e poder fazer estimativas eficientes de mínimos quadrados ordinários (MQO) no modelo inicial. As ferramentas a serem utilizadas são variáveis instrumentais (VI), modelos estruturais e equações reduzidas.
Em outras palavras, o MC2E nos ajuda a fazer uma estimativa com garantias quando uma ou mais variáveis explicativas endógenas se correlacionam com o termo de erro e há exclusão de variáveis explicativas exógenas. MC2E refere-se ao procedimento a seguir para tratar esse problema de endogeneidade.
- Na primeira etapa, um "filtro" é aplicado para eliminar a correlação com o termo de erro.
- Na segunda etapa, são obtidos os valores ajustados a partir dos quais boas estimativas de MQO podem ser feitas na forma reduzida do modelo original.
O modelo estrutural
Um modelo estrutural representa uma equação onde se pretende medir a relação causal entre as variáveis e o foco está nos regressores (βj) O modelo 1 é uma regressão linear múltipla com duas variáveis explicativas: Y2 e Z1
Modelo 1 ⇒ Y1= β0 + β1· Y2 + β2Z1 + vc1
As variáveis explicativas podem ser divididas em dois tipos: variáveis explicativas endógenas e variáveis explicativas exógenas. No Modelo 1, a variável explicativa endógena é Z1 e a variável explicativa exógena é Y2 . A variável endógena é dada pelo modelo (é o resultado do modelo) e está correlacionada com u1. Tomamos a variável exógena como dada (é necessário que o modelo expulse um resultado) e ela não está correlacionada com u1.
Procedimento MC2E
A seguir, explicaremos em detalhes o procedimento para fazer uma estimativa por meio do método dos mínimos quadrados em dois estágios.
Primeira etapa
1. Assumimos que temos duas variáveis explicativas exógenas que são excluídas no Modelo 1, onde Z2 e Z3 . Lembre-se de que já temos uma variável explicativa exógena no Modelo 1, Z1 Portanto, no total, teremos agora três variáveis explicativas exógenas: Z1 , Z2 e Z3
As restrições de exclusão são:
- Z2 e Z3 eles não aparecem no Modelo 1, portanto, eles são excluídos.
- Z2 e Z3 não estão correlacionados com o erro.
2. Temos que obter a equação de forma reduzida para Y2. Para fazer isso, substituímos:
- A variável endógena Y1 por Y2 .
- Os regressores βj por πj .
- O erro você1 por v2 .
A forma reduzida de Y2 do Modelo 1 é:
Y2= π0 + π1Z1 + π2 Z2 + π3 Z3 + v2
No caso de Z2 e Z3 estão correlacionados com Y2 , o método das Variáveis Instrumentais (VI) poderia ser usado, mas acabaríamos com dois estimadores VI e, neste caso, os dois estimadores seriam ineficientes ou imprecisos. Dizemos que um estimador é mais eficiente ou preciso quanto menor for sua variância. O estimador mais eficiente seria aquele com a menor variância possível.
3. Assumimos que a combinação linear anterior é a melhor Variável Instrumental (VI), que chamamos de Y2* para Y2 e removemos o erro (v2) da equação:
Y2* = π0 + π1Z1 + π2 Z2 + π3 Z3 + v2 ∀ π2 ≠ 0, π3 ≠ 0
Segunda etapa
4. Realizamos a estimativa OLS na forma reduzida do Modelo 1 acima e obtemos os valores ajustados (os representamos com o circunflexo “^”). O valor ajustado é a versão estimada de Y2* que por sua vez não está correlacionado com você1 .
5. Obtida a estimativa anterior, ela pode ser usada como VI para Y2 .
Resumo do processo
Método dos mínimos quadrados de dois estágios (LS2E):
- Primeira etapa: Realize a regressão no modelo circunflexo (ponto 4) onde os valores ajustados são obtidos com precisão. Este valor ajustado é a versão estimada de Y2* e, portanto, não está correlacionado com o erro u1 . A ideia é aplicar um filtro de não correlação do valor ajustado com o erro u1 .
- Segunda etapa: Realize a regressão OLS na forma reduzida do Modelo 1 (ponto 2) e obtenha os valores ajustados. Uma vez que o valor ajustado é usado e não o valor original (Y2) não entre em pânico se as estimativas LS2E não corresponderem às estimativas OLS na forma reduzida do Modelo 1.