Neste post explicamos o conceito de graus de liberdade por meio de exemplos práticos e simples.
Em outras palavras, os graus de liberdade são o número de observações puramente livres (que podem variar) quando estimamos os parâmetros.
Exemplo prático
Supomos que vamos a Andorra para ver as finais da Copa do Mundo de Ski porque gostamos muito de esqui alpino. Trazemos um mapa que nos informa onde estão as diferentes disciplinas e o nome dos competidores, mas não especifica o número inicial de cada participante. Cada vez que eles dizem o nome do concorrente, nós o apagamos. Como a lista de competidores é limitada, chegará um momento em que saberemos o nome do competidor antes que ele anuncie pelos alto-falantes.
Supomos que o mapa incorpora uma tabela com o nível de esqui que alguns participantes possuem. Portanto, o mapa nos dá informações sobre o tamanho da amostra (n). Isso nos daria informações sobre o tamanho da população (N) se incluísse todos os concorrentes.
Esquiador | PARA | B | C | D |
Nível | 10 | 8 | 3 | 5 |
Uma vez que as informações que temos são definidas, calculamos os parâmetros de amostra:
Os níveis dos esquiadores podem variar livremente (desvio padrão) menos o último participante que está sujeito à média de 6,5.
Em outras palavras, os esquiadores A, B e C podem ter o nível que desejam, desde que o esquiador D tenha um nível igual à média de 6,5. Essa restrição no último elemento é refletida no denominador do desvio padrão da amostra.
Graus de liberdade no excel
No Excel, também podemos diferenciar os desvios padrão dependendo se estamos calculando estatísticas de amostra ou população.
A primeira etapa é identificar se o conjunto de dados é uma população ou amostra para aplicar uma fórmula ou outra.
Se estivermos estudando um conjunto de dados que pertence a uma amostra (n), vamos aplicar o desvio padrão da amostra ou corrigido com denominador (n-1). A função no Excel é (STDEV).
Se estivermos estudando um conjunto de dados que pertence a uma população (N), vamos aplicar o desvio padrão da população com denominador (N). A função no Excel é (STDEV.P).
Mas existe realmente uma diferença?
Desvio padrão da amostra (n-1): A função do Excel é (STDEV).
Desvio padrão da população (N): a função no Excel é (STDEV.P).
Obviamente, há uma diferença entre os dois desvios padrão.
Aplicação em economia e finanças
Quando todos os elementos do conjunto são conhecidos, a forma populacional do desvio padrão pode ser usada. Ambas as formas são usadas no cálculo do erro de rastreamento, volatilidade relativa, coeficiente de correlação de Pearson, covariância, beta, variância …
Encontramos graus de liberdade do tipo (n-k-1) no cálculo da distribuição t de Student, entre outros.