Critério de informação bayesiano
O critério de informação Bayesiano ou critério de Schwarz é um método que foca na soma dos quadrados dos resíduos para encontrar o número de períodos defasados p que minimizam este modelo.
Em outras palavras, queremos encontrar o número mínimo de períodos defasados que incluímos na autorregressão para nos ajudar com a previsão da variável dependente.
Dessa forma, teremos controle sobre o número de períodos defasados p que estamos incluindo na regressão. Quando ultrapassamos esse nível ótimo, o modelo de Schwarz para de diminuir e, portanto, teremos atingido o mínimo. Ou seja, teremos atingido o número de períodos defasados p que minimizam o modelo de Schwarz.
É também denominado Critério de Informação Bayes (BIC).
Artigos recomendados: autorregressão, soma dos quadrados dos resíduos (SCE).
Fórmula de critério de informação bayesiana
Embora à primeira vista pareça uma fórmula complicada, vamos percorrer algumas partes para entendê-la. Em primeiro lugar, de uma forma geral, devemos:
- Os logaritmos em ambos os fatores da fórmula representam o efeito marginal de incluir um período defasado p mais em auto-regressão.
- N é o número total de observações.
- Podemos dividir a fórmula em duas partes: parte esquerda e parte direita.
A parte à esquerda:
Representa a soma dos quadrados dos resíduos (SCE) da autorregressão dep períodos defasados, dividido pelo número total de observações (N).
Para estimar os coeficientes, usamos mínimos quadrados ordinários (OLS). Assim, quando incluímos novos períodos defasados, o SCE (p) só pode ser mantido ou diminuído.
Então, o aumento de um período defasado na autorregressão causa:
- SCE (p): diminui ou permanece constante.
- Coeficiente de determinação: aumenta.
- EFEITO TOTAL: um aumento em um período defasado causa uma diminuição na parte esquerda da fórmula.
Agora a parte certa:
(p + 1) representa o número total de coeficientes na autorregressão, ou seja, os regressores com seus períodos defasados (p) e a interceptação (1).
Então, o aumento de um período defasado na autorregressão causa:
- (p + 1): aumenta porque incorporamos um período defasado.
- EFEITO TOTAL: um aumento em um período defasado causa um aumento na parte direita da fórmula.
Exemplo prático
Supomos que queremos fazer uma previsão sobre os preços dopasses de esqui para a próxima temporada de 2020 com uma amostra de 5 anos, mas não sabemos quantos períodos de latência usar: AR (2) ou AR (3)?
- Baixamos os dados e calculamos os logaritmos naturais dos preços do passes de esqui.
1. Estimamos os coeficientes usando OLS e obtemos:
Soma dos quadrados dos resíduos (SCE) para AR (2) = 0,011753112
Coeficiente de determinação para AR (2) = 0,085
2. Adicionamos mais 1 período de atraso para ver como o SCE muda:
Soma dos quadrados dos resíduos para AR (3) = 0,006805295
Coeficiente de determinação para AR (3) = 0,47
Podemos ver que quando adicionamos um período defasado na autorregressão, o coeficiente de determinação aumenta e o SCE diminui neste caso.
- Calculamos o critério de informação Bayesiana:
Quanto menor for o modelo BIC, mais preferido será o modelo. Então, AR (3) seria o modelo preferido em relação ao AR (2), dado que seu coeficiente de determinação é maior, o SCE é menor e o modelo de Schwarz ou critério de informação Bayesiano também é menor.