Erros de especificação - O que é, definição e conceito - 2021

Índice:

Erros de especificação - O que é, definição e conceito - 2021
Erros de especificação - O que é, definição e conceito - 2021
Anonim

Os erros de especificação de um modelo econométrico referem-se aos diferentes erros que podem ser cometidos ao selecionar e tratar um conjunto de variáveis ​​independentes para explicar uma variável dependente.

Quando um modelo é construído, ele deve atender à hipótese de especificação correta. Isso se baseia no fato de que as variáveis ​​explicativas selecionadas para o modelo são aquelas capazes de explicar a variável independente. Portanto, assume-se que não existe uma variável independente (x) que possa explicar a variável independente (y) e que desta forma teriam sido escolhidas as variáveis ​​que permitem a abordagem do modelo correto.

Erros de especificação de modelo

Existem vários erros na especificação do modelo que podem ser agrupados em três grandes grupos:

Grupo 1: A forma como funciona não está especificada corretamente

  • Omissão de variáveis ​​relevantes: Vamos imaginar que queremos explicar o retorno das ações da empresa Y. Para fazer isso, selecionamos o PER, a capitalização de mercado e o valor contábil como variáveis ​​independentes. Se o free float for correlacionado com qualquer uma das variáveis ​​contidas no modelo, o erro do nosso modelo seria correlacionado com as variáveis ​​incluídas no modelo. Isso faria com que os parâmetros estimados pelo modelo fossem imparciais e inconsistentes. Assim, os resultados das previsões e dos diferentes testes realizados no modelo não seriam válidos.
  • Variáveis ​​a serem transformadas: A hipótese do modelo de regressão assume que a variável dependente está linearmente relacionada às variáveis ​​independentes. No entanto, em muitas ocasiões, a relação entre eles não é linear. Se a transformação necessária não for feita na variável independente, o modelo não terá o ajuste correto. Como exemplos de transformação de variáveis ​​independentes temos a tomada de logaritmos, a raiz quadrada ou o quadrado entre outros.
  • Coleta deficiente de dados de amostra: Os dados das variáveis ​​independentes devem ser consistentes com o tempo, ou seja, não pode haver mudanças estruturais das variáveis ​​independentes. Vamos imaginar que queremos explicar a variação do PIB no país X usando consumo e investimento como variáveis ​​independentes. Suponha que um campo de petróleo seja descoberto naquele país em terras do estado e o governo decida abolir os impostos. Isso pode levar a uma mudança nos hábitos de consumo do país que, a partir daquela data, serão mantidos por tempo indeterminado. Nesse caso, devemos coletar duas séries temporais diferentes e estimar dois modelos. Um modelo antes da mudança e outro depois. Se agrupássemos os dados em uma única amostra e estimamos um modelo, teríamos um modelo mal especificado e as hipóteses, contrastes e previsões estariam incorretas.

Grupo 2: As variáveis ​​independentes são correlacionadas com o termo de erro na série temporal

  • Uso da variável dependente com lag como variável independente: Usar uma variável com defasagem é usar os dados das mesmas variáveis, mas medidos em um período anterior. Suponha que estejamos usando o modelo anterior do PIB como variável dependente. Vamos adicionar ao modelo, além do consumo e do investimento, o PIB do ano anterior (PIBt-1) Se o PIB do ano anterior fosse serialmente correlacionado com o erro, os coeficientes estimados seriam enviesados ​​e não inconsistentes. Isso novamente invalidaria todos os testes de hipóteses, previsões etc.
  • Prever o passado: Quando medimos uma variável, sempre temos que tomar o período anterior ao que queremos estimar. Suponha que nossa variável dependente seja o retorno da ação X e nossa variável independente seja PER. Suponha ainda que estejamos pegando os dados finais de fevereiro. Se usarmos isso em nosso modelo, concluiremos que a ação com o maior PER no final de fevereiro teve os maiores retornos no final de fevereiro. A correta especificação do modelo implica tomar os dados do início do período para prever os dados posteriores e não o contrário como no caso anterior. Isso é chamado de previsão do passado.
  • Meça a variável independente com erro: Suponha que nossa variável independente seja o retorno de uma ação e uma de nossas variáveis ​​independentes seja a taxa de juros nominal. Lembre-se de que a taxa de juros nominal é a taxa de juros mais a inflação. Como o componente de inflação da taxa de juros nominal não é observável no futuro, estaríamos medindo a variável com erro. Para medir corretamente a taxa de juros, teríamos que usar a taxa de juros esperada e que esta leve em consideração a inflação esperada e não a atual.