O modelo Lagged Distributed Autoregressive (ADR), do inglês Modelo de Lag Distribuído Autoregressivo(ADL), é uma regressão que envolve uma nova variável independente defasada além da variável dependente defasada.
Em outras palavras, o modelo ADR é uma extensão do modelo autorregressivo de ordem p, AR (p), que inclui outra variável independente em um período de tempo anterior ao período da variável dependente.
Exemplo
Com base nos dados de 1995 a 2018, calculamos os logaritmos naturais dopasses de esqui para cada ano e voltamos um período para as variáveispasses de esquit e faixast:
Ano | Passes de esqui (€) | ln_t | ln_t-1 | Tracks_t | Tracks_t-1 | Ano | Passes de esqui (€) | ln_t | ln_t-1 | Tracks_t | Tracks_t-1 |
1995 | 32 | 3,4657 | 8 | 2007 | 88 | 4,4773 | 4,3820 | 6 | 9 | ||
1996 | 44 | 3,7842 | 3,4657 | 6 | 8 | 2008 | 40 | 3,6889 | 4,4773 | 5 | 6 |
1997 | 50 | 3,9120 | 3,7842 | 6 | 6 | 2009 | 68 | 4,2195 | 3,6889 | 6 | 5 |
1998 | 55 | 4,0073 | 3,9120 | 5 | 6 | 2010 | 63 | 4,1431 | 4,2195 | 10 | 6 |
1999 | 40 | 3,6889 | 4,0073 | 5 | 5 | 2011 | 69 | 4,2341 | 4,1431 | 6 | 10 |
2000 | 32 | 3,4657 | 3,6889 | 5 | 5 | 2012 | 72 | 4,2767 | 4,2341 | 8 | 6 |
2001 | 34 | 3,5264 | 3,4657 | 8 | 5 | 2013 | 75 | 4,3175 | 4,2767 | 8 | 8 |
2002 | 60 | 4,0943 | 3,5264 | 5 | 8 | 2014 | 71 | 4,2627 | 4,3175 | 5 | 8 |
2003 | 63 | 4,1431 | 4,0943 | 6 | 5 | 2015 | 73 | 4,2905 | 4,2627 | 9 | 5 |
2004 | 64 | 4,1589 | 4,1431 | 6 | 6 | 2016 | 63 | 4,1431 | 4,2905 | 10 | 9 |
2005 | 78 | 4,3567 | 4,1589 | 5 | 6 | 2017 | 67 | 4,2047 | 4,1431 | 8 | 10 |
2006 | 80 | 4,3820 | 4,3567 | 9 | 5 | 2018 | 68 | 4,2195 | 4,2047 | 6 | 8 |
2019 | ? | ? | 4,2195 | 6 |
Para fazer a regressão, usamos os valores de ln_t como uma variável dependente e os valoresln_t-1 Ytracks_t-1 como variáveis independentes. Os valores em vermelho estão fora da regressão.
Obtemos os coeficientes da regressão:
Nesse caso, o sinal dos regressores é positivo:
- Um aumento de 1€ no preço opasses de esqui na temporada anterior (t-1) teve um aumento de 0,48€no preço depasses de esqui para esta temporada (t).
- Um aumento de uma pista preta inaugurada na temporada anterior (t-1) se traduz em um aumento de 4,1% no preço dopasses de esqui para esta temporada (t).
Os valores entre parênteses abaixo dos coeficientes são os erros padrão das estimativas.
Nós substituímos
Então,
Ano | Passes de esqui (€) | Trilhas | Ano | Passes de esqui (€) | Trilhas |
1995 | 32 | 8 | 2007 | 88 | 6 |
1996 | 44 | 6 | 2008 | 40 | 5 |
1997 | 50 | 6 | 2009 | 68 | 6 |
1998 | 55 | 5 | 2010 | 63 | 10 |
1999 | 40 | 5 | 2011 | 69 | 6 |
2000 | 32 | 5 | 2012 | 72 | 8 |
2001 | 34 | 8 | 2013 | 75 | 8 |
2002 | 60 | 5 | 2014 | 71 | 5 |
2003 | 63 | 6 | 2015 | 73 | 9 |
2004 | 64 | 6 | 2016 | 63 | 10 |
2005 | 78 | 5 | 2017 | 67 | 8 |
2006 | 80 | 9 | 2018 | 68 | 6 |
2019 | 63 |
ADR (p, q) vs. AR (p)
Qual modelo é mais adequado para prever os preços depasses de esqui dadas as observações acima, AR (1) ou ADR (1,1)? Em outras palavras, você incorpora a variável independentetrilhast-1 na regressão ajuda a se ajustar melhor a nossa previsão?
Vemos o R ao quadrado das regressões dos modelos:
Modelo AR (1): R2= 0,33
Modelo ADR (1,1): R2= 0,40
O R2 do modelo ADR (1,1) é maior que R2 do modelo AR (1). Isso significa que inserir a variável independentetrilhast-1 na regressão, ajuda a se ajustar melhor à nossa previsão.