Ajustado R quadrado (coeficiente de determinação ajustado) - 2021

Índice:

Ajustado R quadrado (coeficiente de determinação ajustado) - 2021
Ajustado R quadrado (coeficiente de determinação ajustado) - 2021
Anonim

O R quadrado ajustado (ou coeficiente de determinação ajustado) é usado na regressão múltipla para ver o grau de intensidade ou eficácia das variáveis ​​independentes na explicação da variável dependente.

Em palavras mais simples, o R-quadrado ajustado nos diz qual porcentagem da variação da variável dependente é explicada coletivamente por todas as variáveis ​​independentes.

O uso desse coeficiente se justifica porque, à medida que adicionamos variáveis ​​a uma regressão, o coeficiente de determinação não ajustado tende a aumentar. Mesmo quando a contribuição marginal de cada uma das novas variáveis ​​adicionadas não tem relevância estatística.

Portanto, ao adicionar variáveis ​​ao modelo, o coeficiente de determinação poderia aumentar e poderíamos pensar, erroneamente, que o conjunto de variáveis ​​escolhido é capaz de explicar grande parte da variação da variável independente. Esse problema é comumente conhecido como “superestimação do modelo”.

Coeficiente de variaçãoAnálise de regressão

Fórmula ajustada do coeficiente de determinação

Para resolver o problema descrito acima, muitos pesquisadores sugerem ajustar o coeficiente de determinação usando a seguinte fórmula:

R2 para → Ajustado R quadrado ou coeficiente de determinação ajustado

R2 → R ao quadrado ou coeficiente de determinação

n → Número de observações na amostra

k → Número de variáveis ​​independentes

Considerando que 1-R2 é um número constante e, como n é maior que k, à medida que adicionamos variáveis ​​ao modelo, o quociente entre parênteses se torna maior. Consequentemente. também o resultado da multiplicação disso por 1-R2 . Com o que vemos que a fórmula é construída para ajustar e penalizar a inclusão de coeficientes no modelo.

Além da vantagem anterior, o ajuste usado na fórmula anterior também nos permite comparar modelos com diferentes números de variáveis ​​independentes. Novamente, a fórmula ajusta o número de variáveis ​​entre um modelo e outro e nos permite fazer uma comparação homogênea.

Voltando à fórmula anterior, podemos deduzir que o coeficiente de determinação ajustado será sempre igual ou menor que o coeficiente de R2. Ao contrário do coeficiente de determinação que varia entre 0 e 1, o coeficiente de determinação ajustado pode ser negativo por 2 motivos:

  • Quanto mais perto k se aproxima de n.
  • Quanto menor o coeficiente de determinação.
Coeficiente de correlação linear