A correlação, também conhecida como coeficiente de correlação linear (Pearson), é uma medida de regressão que tenta quantificar o grau de variação conjunta entre duas variáveis.
Portanto, é uma medida estatística que quantifica a dependência linear entre duas variáveis, ou seja, se os valores tomados por duas variáveis forem representados em um diagrama de dispersão, o coeficiente de correlação linear indicará quão bom ou ruim o conjunto de pontos representado se aproxima de uma linha.
De forma menos coloquial, podemos defini-lo como o número que mede o grau de intensidade e o sentido da relação entre duas variáveis.
Sendo:
Cov (x; y): a covariância entre o valor "x" e "y".
σ (x): desvio padrão de "x".
σ (y): desvio padrão de "y".
Valores que a correlação pode assumir
ρ = -1 correlação perfeita negativa
ρ = 0 Não há correlação
ρ = +1 correlação perfeita positiva
Falamos de correlação positiva se sempre que o valor “x” aumenta, o valor “y” aumenta, e também com a mesma intensidade (+1).
Caso contrário, se sempre que o valor “x” subir e o valor “y” cair, e também com a mesma intensidade, estamos a falar de correlação negativa (-1).
É importante saber que isso não significa que o façam na mesma proporção (a menos que tenham o mesmo desvio padrão).
Análise de regressãoRepresentação gráfica da correlação
Correlação perfeita positiva:
Não há correlação:
Correlação perfeita negativa:
Dica: em muitas ocasiões, não temos os meios ou os dados para usar esta fórmula. Portanto, se tivermos duas séries de preços, podemos calcular o coeficiente de correlação no Excel, usando a seguinte função: coef.de.correl (série de preços x; série de preços y).
r ao quadrado ou coeficiente de determinaçãoCoeficiente de variação