O processo estatístico é o conjunto de etapas ou fases que devem ser cumpridas para realizar uma investigação com base em informações quantitativas e obter resultados fiéis à realidade estudada.
Quando falamos de processo estatístico, estamos falando de uma série de etapas que é aconselhável realizar para obter resultados fiéis à realidade que estudamos no estudo estatístico que se pretende realizar. Isso é necessário, pois se não seguirmos essas etapas podemos tirar conclusões erradas e, portanto, tomar decisões erradas.
Por exemplo, vamos imaginar que temos uma sorveteria. Precisamos saber, aproximadamente, quanto sorvete devemos comprar com base na quantidade de demanda que teremos. Portanto, se falharmos, os clientes podem entrar em contato com quem teremos que dizer a eles que não há sorvete nesta sorveteria. Pelo contrário, se tivermos muito, pode estragar. Portanto, é necessário tentar estimar quanto devemos comprar, ou pelo menos uma faixa aproximada. Se para calcularmos esse intervalo, coletarmos dados não representativos (por exemplo, uma sorveteria localizada em outra cidade com menos afluência), podemos estar errados.
Então, tendo isso claro, devemos conhecer a série de etapas e detalhes que devemos seguir para que os resultados se adaptem à realidade e tomemos as melhores decisões.
Etapas do processo estatístico
Dependendo do manual visitado ou do autor, podemos ver diferentes etapas com nomes diferentes. Em essência, quase todos os documentos sobre o assunto incluem as mesmas seções, apenas que alguns incluem várias fases em uma e outros fragmentam mais o processo.
No nosso caso, consideramos que o processo estatístico consiste em:
Exposição do problema
Na formulação do problema, o eixo central está localizado no qual articular tudo o mais. Esta fase responde à seguinte pergunta: O que eu preciso estudar e por quê? Às vezes, por mais incrível que pareça ser o problema, pode nos levar à conclusão de que não precisamos realmente fazer um estudo estatístico.
Coleta de Dados
Depois de levantar o problema, devemos coletar os dados. Aqui, a metodologia é importante. Portanto, existem diferentes considerações. Assim, devemos estabelecer o tipo de amostragem, o tamanho da amostra, o tipo de coleta de dados (por exemplo, por meio de bancos de dados ou pesquisas personalizadas), pessoalmente, online ou por telefone, etc.
Organização de dados
Assim que tivermos todos os dados, resta unificá-los e organizá-los. Como em tudo, precisamos inserir os dados em um programa ou plataforma que nos permita calcular certas métricas e analisá-los corretamente. Para fazer isso, é sempre conveniente organizar os dados. Além do mais, às vezes precisaremos coletar dados de diferentes bancos de dados que oferecem diferentes formatos de arquivo e será necessário unificar tudo no mesmo formato.
Análise de dados
Uma vez que o problema é levantado, os dados coletados e organizados, podemos analisá-lo de forma eficaz. Dependendo da definição do problema, um ou outro tipo de análise será realizado. Por exemplo, se quisermos saber se duas variáveis são dependentes, poderíamos usar uma análise de cointegração. Já se o que queremos estudar é a dispersão total de um ativo financeiro, calcularemos o intervalo estatístico.
Interpretação dos dados
Por último, mas não menos importante, temos a interpretação dos dados. É inútil realizar todas as fases do processo estatístico corretamente se no final a interpretação estiver errada. Isso porque, se a interpretação estiver errada, as decisões terão um efeito indesejado. Por exemplo, suponha que conduzamos um estudo sobre a variabilidade das vendas de uma empresa. Se assim que obtivermos os resultados descobrir que há muita dispersão, ela deve ser reduzida e interpretamos que não, isso pode afetar negativamente a empresa.
As cinco etapas são refletidas no diagrama a seguir:
Estatística descritiva