Neste post, explicamos as propriedades da distribuição t de Student.
Em outras palavras, a distribuição t é uma distribuição de probabilidade que estima o valor da média de uma pequena amostra retirada de uma população que segue uma distribuição normal para a qual não sabemos seu desvio padrão.
Artigos recomendados: graus de liberdade, graus de liberdade (exemplo) e distribuição normal.
História
William Sealy Gosset (1876-1937) em 1908 teve a necessidade de criar uma distribuição para ajudá-lo nos cálculos estatísticos das cervejas da marca Guinness na Irlanda. Como os resultados tiveram que ser publicados usando dados privados da cervejaria para demonstrar a aplicabilidade de sua nova distribuição, a empresa proibiu seus funcionários de publicar informações confidenciais. Essa limitação não impediu Gosset de publicar sua descoberta sob o pseudônimo de Aluna. A partir desse momento, a distribuição t é reconhecida como distribuição t de Student.
Propriedades da distribuição t de Student
As propriedades da distribuição t de Student são as seguintes:
- É uma distribuição simétrica. O valor da média, mediana e moda coincidem. Matematicamente,
- É uma distribuição unimodal. Os valores mais frequentes ou com maior probabilidade de aparecer (modo) estão em torno da média. Quando nos afastamos da média, a probabilidade dos valores aparecerem e sua frequência diminui.
- Se tivermos uma amostra de tamanho n, teremos uma distribuição t com (n-1) graus de liberdade.
Em outras palavras, a distribuição terá o mesmo número de observações em ambos os lados do valor central.
- A função de densidade não depende dos graus de liberdade para ser simétrica.
- A representação gráfica se parece com a distribuição normal, ou seja, também tem a forma de um sino.
- O valor médio ou médio é zero (0).
- Quanto mais os graus de liberdade aumentam, mais semelhante será a distribuição t à distribuição normal.
Distribuição normal vs distribuição t
A distribuição t e a distribuição normal diferem principalmente porque a distribuição t atribui mais probabilidade a observações extremas do que a distribuição normal padrão (variância maior que 1). Em outras palavras, a distribuição t tem caudas mais largas do que a distribuição normal.