Sinal estatístico - O que é, definição e conceito - 2021

Índice:

Sinal estatístico - O que é, definição e conceito - 2021
Sinal estatístico - O que é, definição e conceito - 2021
Anonim

Uma amostra estatística é um subconjunto de dados pertencente a uma população de dados. Estatisticamente falando, deve ser constituído por um certo número de observações que representem adequadamente o total dos dados.

A estatística, como um ramo da matemática, é responsável por coletar dados, ordená-los e analisá-los. Em outras palavras, quando queremos estudar um determinado fenômeno, recorremos à estatística. Um bom exemplo de fenômeno estudado pelas estatísticas é o salário médio dos cidadãos de um país

Nesse sentido, por razões de tempo e custo, não podemos coletar todos os dados. Essa totalidade de dados é conhecida como população de dados ou simplesmente população.

Por que você trabalha com amostras estatísticas?

Para explicar por que uma amostra estatística é usada em vez da população total, vamos recorrer ao exemplo levantado acima.

Suponha que queremos estudar qualquer fenômeno. No nosso caso, esse fenômeno é o salário médio dos cidadãos de um país. A população de dados é composta por todos e cada um dos trabalhadores do país. É claro que, por questões de tempo e custo, seria impossível perguntar a cada trabalhador quanto é seu salário anual. Levaria muito tempo ou precisaríamos de muitos recursos.

Nesse ponto, surge o conceito de amostra estatística. Em vez de pedir a milhões de trabalhadores em um país ou região, coletamos apenas uma pequena quantidade de dados. Por exemplo, perguntamos a 100.000 pessoas. Esta tarefa ainda é complicada, mas é muito mais acessível pedir a 100.000 pessoas do que a 30 milhões.

Essa pequena quantidade de dados deve ser representativa. Ou seja, deve representar adequadamente a população. Se as 100.000 pessoas que perguntamos estiverem concentradas em bairros ricos, obteremos dados não representativos. O salário médio seria muito mais alto do que realmente é.

Características de uma amostra estatística representativa

Se você deseja fazer uma boa pesquisa, a qualidade da amostra estatística é essencial. É inútil executar as métricas estatísticas mais complexas com os modelos mais sofisticados se a amostra estatística for tendenciosa. Ou seja, se a amostra não for representativa.

Na obtenção de uma amostra representativa existem alguns aspectos que o pesquisador deve conhecer com antecedência. Entre esses aspectos estão as características de uma amostra representativa. As características de uma amostra representativa são as seguintes:

  • Tamanho grande o suficiente: Quando trabalhamos com amostras, normalmente estamos trabalhando com uma quantidade de dados menor do que a população. No entanto, para que uma amostra estatística seja representativa, ela deve ser grande o suficiente para ser considerada representativa. Por exemplo, se nossa população é composta por 10 milhões de dados e escolhemos 10, é difícil que seja representativa. Claro, quanto maior a amostra nem sempre é mais representativa.
  • Aleatoriedade: A seleção de dados de uma amostra estatística deve ser aleatória. Ou seja, deve ser totalmente aleatório. Se, em vez de fazer isso de forma aleatória, realizamos um processo de seleção de dados planejado, estamos introduzindo um viés na coleta de dados. Portanto, para evitar que a amostra seja enviesada e, portanto, para torná-la uma amostra representativa, devemos fazer uma seleção aleatória.

Inferência estatística

Uma vez obtida temos a amostra representativa, então é necessário inferir certas métricas. Freqüentemente, estamos interessados ​​em saber uma certa medida de uma variável. No exemplo inicial, a variável seria o salário dos cidadãos de um país. Nesse sentido, a métrica que queremos analisar é o salário médio dos cidadãos de um país.

Em outras palavras, temos uma população de dados composta por todos os trabalhadores do México. Dessa população obtemos uma variável, ou seja, o salário anual. Usando as técnicas apropriadas, obtemos uma amostra representativa. E, finalmente, uma vez que temos um conjunto de dados com o qual podemos trabalhar, usamos técnicas de inferência estatística para calcular o salário médio.

Claro, uma vez que temos o conjunto de dados, podemos inferir outras medidas. Por exemplo, como o salário é distribuído, qual a porcentagem de trabalhadores que está abaixo de um determinado salário ou qual é a diferença salarial.

Exemplo de amostra estatística

Suponha que queiramos realizar um estudo sobre o gasto médio das famílias colombianas no mês de janeiro. Para isso temos duas opções:

  1. Insira as contas bancárias de todas as famílias na Colômbia
  2. Pergunte a um número representativo de pessoas

A primeira opção não é viável por vários motivos. Primeiro, que as famílias não vão ceder seus dados e, segundo, que também não poderíamos ir de família em família olhando os dados. Principalmente porque a população da Colômbia é de cerca de 50 milhões. Enquanto isso, o segundo é a opção de coletar uma amostra estatística.

O que faremos, seguindo as características mencionadas acima, será pedir a 100.000 famílias. É um tanto complicado, mas muito mais fácil do que pedir a 50 milhões de colombianos. A diferença é considerável. Assim, com base nessa amostra de 100.000 famílias, tentaremos calcular o gasto médio das famílias em janeiro.

Os dados extraídos serão mais ou menos confiáveis ​​de acordo com uma série de métricas que são levadas em consideração nas investigações estatísticas. Obviamente, esses tipos de métricas são mais avançados e, portanto, não os discutiremos aqui.