Distribuição normal - O que é, definição e conceito

Índice:

Anonim

A distribuição normal é um modelo teórico capaz de aproximar satisfatoriamente o valor de uma variável aleatória de uma situação ideal.

Em outras palavras, a distribuição normal ajusta uma variável aleatória a uma função que depende da média e do desvio padrão. Ou seja, a função e a variável aleatória terão a mesma representação, mas com pequenas diferenças.

Uma variável aleatória contínua pode assumir qualquer número real. Por exemplo, retornos de ações, resultados de testes, IQ e erros padrão são variáveis ​​aleatórias contínuas.

Uma variável aleatória discreta assume valores naturais. Por exemplo, o número de alunos em uma universidade.

A distribuição normal é a base para outras distribuições, como distribuição t de Student, distribuição qui-quadrado, distribuição F de Fisher e outras distribuições.

Fórmula da distribuição normal

Dada uma variável aleatória X, dizemos que a frequência de suas observações pode ser satisfatoriamente aproximada a uma distribuição normal, de modo que:

Onde os parâmetros da distribuição são a média ou valor central e o desvio padrão:

Em outras palavras, estamos dizendo que a frequência de uma variável aleatória X pode ser representada por uma distribuição normal.

Representação

Função de densidade de probabilidade de uma variável aleatória que segue uma distribuição normal.

Propriedades

  • É uma distribuição simétrica. O valor da média, mediana e moda coincidem. Matematicamente,

Média = Mediana = Modo

  • Distribuição unimodal. Os valores mais frequentes ou com maior probabilidade de aparecerem estão em torno da média. Em outras palavras, quando nos afastamos da média, a probabilidade dos valores aparecerem e sua frequência diminui.

O que precisamos para representar uma distribuição normal?

  • Uma variável aleatória.
  • Calcule a média.
  • Calcule o desvio padrão.
  • Decida a função que queremos representar: função de densidade de probabilidade ou função de distribuição.

Exemplo teórico

Assumimos que queremos saber se os resultados de um teste podem aproximar-se satisfatoriamente de uma distribuição normal.

Sabemos que 476 alunos participam deste teste e que os resultados podem variar de 0 a 10. Calculamos a média e o desvio padrão a partir das observações (resultados do teste).

Portanto, definimos a variável aleatória X como as pontuações dos testes que dependem de cada resultado individual. Matematicamente,

A pontuação de cada aluno é registrada em uma tabela. Dessa forma, obteremos uma visão global dos resultados e sua frequência.

ResultadosFrequência
020
131
244
356
464
566
662
751
839
926
1016
TOTAL476

Feita a tabela, representamos os resultados do exame e as frequências. Se o gráfico se parecer com a imagem anterior e atender às propriedades, então a variável dos resultados do teste pode ser satisfatoriamente aproximada de uma distribuição normal de média 4,8 e desvio padrão de 3,09.

Os resultados do teste podem aproximar-se de uma distribuição normal?

Razões para considerar que a variável dos resultados do teste segue uma distribuição normal:

  • Distribuição simétrica. Ou seja, há o mesmo número de observações à direita e à esquerda do valor central. Além disso, que a média, a mediana e a moda têm o mesmo valor.

Média = Mediana = Modo = 5

  • As observações com maior frequência ou probabilidade estão em torno do valor central. Em outras palavras, as observações com menor frequência ou probabilidade estão longe do valor central.

A distribuição normal descreve a variável aleatória por uma aproximação que produz erros padrão (as barras acima de cada coluna). Esses erros são a diferença entre as observações reais (resultados) e a função de densidade (distribuição normal).