A distribuição normal é um modelo teórico capaz de aproximar satisfatoriamente o valor de uma variável aleatória de uma situação ideal.
Em outras palavras, a distribuição normal ajusta uma variável aleatória a uma função que depende da média e do desvio padrão. Ou seja, a função e a variável aleatória terão a mesma representação, mas com pequenas diferenças.
Uma variável aleatória contínua pode assumir qualquer número real. Por exemplo, retornos de ações, resultados de testes, IQ e erros padrão são variáveis aleatórias contínuas.
Uma variável aleatória discreta assume valores naturais. Por exemplo, o número de alunos em uma universidade.
A distribuição normal é a base para outras distribuições, como distribuição t de Student, distribuição qui-quadrado, distribuição F de Fisher e outras distribuições.
Fórmula da distribuição normal
Dada uma variável aleatória X, dizemos que a frequência de suas observações pode ser satisfatoriamente aproximada a uma distribuição normal, de modo que:
Onde os parâmetros da distribuição são a média ou valor central e o desvio padrão:
Em outras palavras, estamos dizendo que a frequência de uma variável aleatória X pode ser representada por uma distribuição normal.
Representação
Função de densidade de probabilidade de uma variável aleatória que segue uma distribuição normal.
Propriedades
- É uma distribuição simétrica. O valor da média, mediana e moda coincidem. Matematicamente,
Média = Mediana = Modo
- Distribuição unimodal. Os valores mais frequentes ou com maior probabilidade de aparecerem estão em torno da média. Em outras palavras, quando nos afastamos da média, a probabilidade dos valores aparecerem e sua frequência diminui.
O que precisamos para representar uma distribuição normal?
- Uma variável aleatória.
- Calcule a média.
- Calcule o desvio padrão.
- Decida a função que queremos representar: função de densidade de probabilidade ou função de distribuição.
Exemplo teórico
Assumimos que queremos saber se os resultados de um teste podem aproximar-se satisfatoriamente de uma distribuição normal.
Sabemos que 476 alunos participam deste teste e que os resultados podem variar de 0 a 10. Calculamos a média e o desvio padrão a partir das observações (resultados do teste).
Portanto, definimos a variável aleatória X como as pontuações dos testes que dependem de cada resultado individual. Matematicamente,
A pontuação de cada aluno é registrada em uma tabela. Dessa forma, obteremos uma visão global dos resultados e sua frequência.
Resultados | Frequência |
0 | 20 |
1 | 31 |
2 | 44 |
3 | 56 |
4 | 64 |
5 | 66 |
6 | 62 |
7 | 51 |
8 | 39 |
9 | 26 |
10 | 16 |
TOTAL | 476 |
Feita a tabela, representamos os resultados do exame e as frequências. Se o gráfico se parecer com a imagem anterior e atender às propriedades, então a variável dos resultados do teste pode ser satisfatoriamente aproximada de uma distribuição normal de média 4,8 e desvio padrão de 3,09.
Os resultados do teste podem aproximar-se de uma distribuição normal?
Razões para considerar que a variável dos resultados do teste segue uma distribuição normal:
- Distribuição simétrica. Ou seja, há o mesmo número de observações à direita e à esquerda do valor central. Além disso, que a média, a mediana e a moda têm o mesmo valor.
Média = Mediana = Modo = 5
- As observações com maior frequência ou probabilidade estão em torno do valor central. Em outras palavras, as observações com menor frequência ou probabilidade estão longe do valor central.
A distribuição normal descreve a variável aleatória por uma aproximação que produz erros padrão (as barras acima de cada coluna). Esses erros são a diferença entre as observações reais (resultados) e a função de densidade (distribuição normal).