Uma variável categórica é aquela que permite classificar uma série de dados por meio de valores fixos associados a uma determinada qualidade ou categoria.
A variável categórica, ao contrário das variáveis cardinais ou contínuas (que permitem cálculos numéricos), classifica indivíduos ou casos. Normalmente assumem valores representados por números inteiros, como um ou zero, mas são apenas isso, representações.
No exemplo, veremos com mais detalhes.
Diferenças entre variável categórica e contínua
Existem algumas diferenças entre a variável categórica e a variável contínua ou cardinal que devem ser conhecidas. Vamos ver o mais relevante.
- Primeiro, a variável categórica é usada para agrupamento e a variável contínua para contagem. Em outras palavras, o primeiro permite que categorias sejam formadas com uma série de dados. Por exemplo, sexo ou número de filhos. O segundo nos dá informações numéricas. Por exemplo, idade.
- A variável cardinal permite cálculos numéricos, as outras não. Desta forma, nas primeiras podemos conhecer as médias ou variâncias, enquanto nas outras apenas alguns dados, como a moda ou a porcentagem das categorias.
- Os categóricos são muito úteis para conhecer informações qualitativas, ou seja, alguma qualidade dos dados. Os contínuos nos fornecem dados quantitativos, ou seja, quantidades e valores representados por números.
Técnicas estatísticas para variáveis categóricas
A seguir, vamos ver as técnicas estatísticas mais utilizadas em variáveis categóricas, comparando-as com as de variáveis contínuas ou cardinais.
- Estatística descritiva: Neste tipo de variáveis, as análises são normalmente baseadas em diagramas de barras e percentuais, entre outros. Os cardinais permitem a aplicação de técnicas de análise para calcular estatísticas de posição, como quantis, ou estatísticas de dispersão, como variâncias.
- Contraste de hipótese: Na categórica, os resultados podem ser extrapolados por meio de testes de hipóteses não paramétricas. Já os contínuos usam contrastes paramétricos que também podem ser inferidos.
- Técnicas de regressão: Neste caso, para o primeiro, utiliza-se a regressão logística ou similar, entre outras. Para o outro tipo de variáveis, a técnica mais utilizada é a regressão linear.
Exemplo de variável categórica
Para terminar, vamos dar uma olhada em um exemplo muito comum em marketing. Vamos imaginar que queremos vender um produto e temos interesse em saber como está o estado civil.
Para fazer isso, atribuiremos 1 para solteiro, 2 para casado, 3 para divorciado, 4 para companheiro e 5 para outras pessoas.
Vamos ver a imagem e depois comentar:
Nele, podemos perceber que o maior percentual de indivíduos são solteiros, casados e divorciados, sendo as outras duas opções de apenas 5%.
Como podemos ver, as variáveis categóricas são úteis para agrupamento. O gráfico de barras permite observar melhor esses percentuais, pois é mais fácil comparar o tamanho das barras.