Função de autocorrelação simples - exemplo em R - 2021

Índice:

Função de autocorrelação simples - exemplo em R - 2021
Função de autocorrelação simples - exemplo em R - 2021
Anonim

Em outras palavras, a Função de Autocorrelação Simples (FAS), ou do inglês, Função de autocorrelação, É uma função matemática que nos ajuda a saber quão dependentes os dados de um determinado período têm dos mesmos dados de k períodos anteriores.

Geramos uma série temporal anual X que segue uma distribuição normal mais uma inércia. Também podemos usar dados reais.

Metodologia

Os programas são essenciais para trabalhar na análise de autocorrelação. Programas como Python podem ser usados, mas para análise estatística e gerenciamento de dados, recomendamos R, ou sua versão aprimorada, R Studio. Aqui vamos trabalhar com a R.

Cálculo

E como escrevemos a fórmula FAS no código R?

Ambos R e Python têm bibliotecas onde as fórmulas são vinculadas a um nome. Então, basta instalarmos a biblioteca que contém a fórmula que queremos usar e chamá-la no script.

Na quion de R, temos que escrever:

A função acf está dentro da biblioteca Estatísticas.

X -> Séries temporais que usamos como amostra para calcular o FAS.

acf (X, ylim = c (-1,1)) -> Função de autocorrelação simples em X com limites no eixo vertical entre -1 e 1, que são os valores que o coeficiente de autocorrelação pode assumir.

Verificação

Esta etapa não é necessária se tivermos usado o código anterior, pois ele calcula as próprias bandas de confiança.

Para determinar se os coeficientes de autocorrelação calculados são estatisticamente significativos, teremos que estabelecer bandas de confiança com os valores críticos. Desta forma, dado um percentual de significância, podemos afirmar com certeza estatística se há ou não presença de autocorrelação nos dados.

Da mesma forma que o coeficiente de correlação, o coeficiente de autocorrelação também assume normalidade e, portanto, calcularemos o intervalo de confiança da seguinte forma:

Definimos o teste de hipótese como:

Com 95% de confiança com um nível de significância de 5%, encontramos o famoso 1,96 nas tabelas normais. O valor crítico é dado por:

Onde a variância dos coeficientes é dada pela aproximação:

Embora forneçamos a fórmula, recomendamos o uso de programas estatísticos para maior precisão e velocidade.

Resultado

Todas as linhas que terminam fora da banda de confiança significam que a série temporal apresenta autocorrelação no período indicado.

Assim, com base no gráfico, vemos que há presença de autocorrelação nesta série temporal nos períodos em que a linha se projeta da banda descontínua.

A primeira linha que está em 0 e dispara em direção a 1 pode ser ignorada, pois t deve ser estritamente maior que 0 e, neste caso, não é. Não faz muito sentido ter que fazer todos os passos anteriores para saber a autocorrelação de agora com agora porque já a conhecemos: a correlação de uma variável consigo mesma é 1, então já temos a resposta.