As medidas de dispersão tentam, através do cálculo de diferentes fórmulas, produzir um valor numérico que ofereça informações sobre o grau de variabilidade de uma variável.
Em outras palavras, medidas de dispersão são números que indicam se uma variável se move muito, um pouco, mais ou menos que outra. A razão de ser deste tipo de medida é conhecer de forma resumida uma característica da variável estudada. Nesse sentido, devem acompanhar as medidas de tendência central. Juntos, eles fornecem informações em um único olhar que podemos usar para comparar e, se necessário, tomar decisões.
Principais medidas de dispersão
As medidas de dispersão mais conhecidas são: o intervalo, a variância, o desvio padrão e o coeficiente de variação (não deve ser confundido com coeficiente de determinação). A seguir, veremos essas quatro medidas.
Classificação
O intervalo é um valor numérico que indica a diferença entre o valor máximo e mínimo de uma população ou amostra estatística. Sua fórmula é:
R = Maxx - minx
Onde:
- R → É o alcance.
- Max → É o valor máximo da amostra ou população.
- Min → É o valor mínimo da amostra ou população estatística.
- x → É a variável sobre a qual essa medida deve ser calculada.
Variância
Variância é uma medida de dispersão que representa a variabilidade de uma série de dados em relação à sua média. Formalmente, é calculado como a soma dos resíduos quadrados divididos pelo total de observações. Sua fórmula é a seguinte:
- X → Variável na qual a variância deve ser calculada
- xeu → Observação número i da variável X. i pode assumir valores entre 1 e n.
- N → Número de observações.
- x̄ → É a média da variável X.
Desvio típico
O desvio padrão é outra medida que fornece informações sobre a dispersão em relação à média. Seu cálculo é exatamente igual à variância, mas tomando a raiz quadrada de seu resultado. Ou seja, o desvio padrão é a raiz quadrada da variância.
- X → Variável na qual a variância deve ser calculada
- xeu → Observação número i da variável X. i pode assumir valores entre 1 e n.
- N → Número de observações.
- x̄ → É a média da variável X.
Coeficiente de variação
Seu cálculo é obtido dividindo o desvio padrão pelo valor absoluto da média do conjunto e geralmente é expresso em porcentagem para melhor compreensão.
- X → Variável na qual a variância deve ser calculada
- σx → Desvio padrão da variável X.
- | x̄ | → É a média da variável X em valor absoluto com x̄ ≠ 0
Abaixo está uma imagem que resume as fórmulas acima:
Para fins comparativos, é importante indicar que devemos sempre comparar variáveis com as mesmas unidades de medida. Por exemplo, não faria muito sentido dizer que a variabilidade do produto interno bruto (PIB) é maior do que a das vendas de sorvete. Por procuração, pode ser indicado, mas comparar euros com número de gelados não faz sentido. Portanto, é sempre melhor comparar variáveis com a mesma unidade de medida.
O mesmo é verdadeiro para medidas de dispersão. Se o que se deseja é comparar duas variáveis, é preferível fazê-lo com as mesmas medidas de dispersão para cada uma delas e de preferência na mesma unidade.