Distribuição t de Student - O que é, definição e conceito

Índice:

Anonim

A distribuição t de Student ou distribuição t é um modelo teórico usado para aproximar o momento de primeira ordem de uma população normalmente distribuída quando o tamanho da amostra é pequeno e o desvio padrão é desconhecido.

Em outras palavras, a distribuição t é uma distribuição de probabilidade que estima o valor da média de uma pequena amostra retirada de uma população que segue uma distribuição normal e para a qual não sabemos seu desvio padrão.

Artigos recomendados: graus de liberdade, graus de liberdade (exemplo) e distribuição normal.

Fórmula de distribuição t de Student

Dada uma variável aleatória contínua L, dizemos que a frequência de suas observações pode ser satisfatoriamente aproximada a uma distribuição t com g graus de liberdade tais que:

Representação da distribuição t de Student

Função de densidade de uma distribuição t com 3 graus de liberdade (df).

Como podemos ver, a representação da distribuição t se parece muito com a distribuição normal, exceto que a distribuição normal tem caudas mais largas e é mais reforçada. Em outras palavras, devemos adicionar mais graus de liberdade à distribuição t para que a distribuição “cresça” e se pareça mais com a distribuição normal.

Especialidade

E… Por que a distribuição t é tão especial?

Bem, porque ao contrário da distribuição normal que depende da média e da variância, a distribuição t depende apenas dos graus de liberdade, do inglês, graus de liberdade (df). Em outras palavras, controlando os graus de liberdade, controlamos a distribuição.

Aplicação t do aluno

A distribuição t é usada quando:

  • Queremos estimar a média de uma população normalmente distribuída a partir de uma pequena amostra.
  • O tamanho da amostra é inferior a 30 itens, ou seja, n <30.

A partir de 30 observações, a distribuição t se assemelha muito à distribuição normal, portanto, usaremos a distribuição normal.

  • O desvio padrão de uma população não é conhecido e deve ser estimado a partir das observações da amostra.

Exemplo

Assumimos que temos 28 observações de uma variável aleatória G que segue uma distribuição t de Student com 27 graus de liberdade (df).

Matematicamente,

Como estamos trabalhando com dados reais, sempre haverá um erro de aproximação entre os dados e a distribuição. Em outras palavras, a média, a mediana e a moda nem sempre serão zero (0) ou exatamente iguais.

Representamos a frequência de cada observação da variável G por meio de um histograma.

A variável aleatória G pode se aproximar de uma distribuição t?

Razões para considerar que a variável G segue uma distribuição t:

  • A distribuição é simétrica. Ou seja, há o mesmo número de observações à direita e à esquerda do valor central. Além disso, que a média e a mediana tendem a estar próximas do mesmo valor. A média é aproximadamente zero, média = 0,016.
  • As observações com maior frequência ou probabilidade estão em torno do valor central. Observações com menor frequência ou probabilidade estão longe do valor central.