A distribuição t de Student ou distribuição t é um modelo teórico usado para aproximar o momento de primeira ordem de uma população normalmente distribuída quando o tamanho da amostra é pequeno e o desvio padrão é desconhecido.
Em outras palavras, a distribuição t é uma distribuição de probabilidade que estima o valor da média de uma pequena amostra retirada de uma população que segue uma distribuição normal e para a qual não sabemos seu desvio padrão.
Artigos recomendados: graus de liberdade, graus de liberdade (exemplo) e distribuição normal.
Fórmula de distribuição t de Student
Dada uma variável aleatória contínua L, dizemos que a frequência de suas observações pode ser satisfatoriamente aproximada a uma distribuição t com g graus de liberdade tais que:
Representação da distribuição t de Student
Função de densidade de uma distribuição t com 3 graus de liberdade (df).
Como podemos ver, a representação da distribuição t se parece muito com a distribuição normal, exceto que a distribuição normal tem caudas mais largas e é mais reforçada. Em outras palavras, devemos adicionar mais graus de liberdade à distribuição t para que a distribuição “cresça” e se pareça mais com a distribuição normal.
Especialidade
E… Por que a distribuição t é tão especial?
Bem, porque ao contrário da distribuição normal que depende da média e da variância, a distribuição t depende apenas dos graus de liberdade, do inglês, graus de liberdade (df). Em outras palavras, controlando os graus de liberdade, controlamos a distribuição.
Aplicação t do aluno
A distribuição t é usada quando:
- Queremos estimar a média de uma população normalmente distribuída a partir de uma pequena amostra.
- O tamanho da amostra é inferior a 30 itens, ou seja, n <30.
A partir de 30 observações, a distribuição t se assemelha muito à distribuição normal, portanto, usaremos a distribuição normal.
- O desvio padrão de uma população não é conhecido e deve ser estimado a partir das observações da amostra.
Exemplo
Assumimos que temos 28 observações de uma variável aleatória G que segue uma distribuição t de Student com 27 graus de liberdade (df).
Matematicamente,
Como estamos trabalhando com dados reais, sempre haverá um erro de aproximação entre os dados e a distribuição. Em outras palavras, a média, a mediana e a moda nem sempre serão zero (0) ou exatamente iguais.
Representamos a frequência de cada observação da variável G por meio de um histograma.
A variável aleatória G pode se aproximar de uma distribuição t?
Razões para considerar que a variável G segue uma distribuição t:
- A distribuição é simétrica. Ou seja, há o mesmo número de observações à direita e à esquerda do valor central. Além disso, que a média e a mediana tendem a estar próximas do mesmo valor. A média é aproximadamente zero, média = 0,016.
- As observações com maior frequência ou probabilidade estão em torno do valor central. Observações com menor frequência ou probabilidade estão longe do valor central.