Uma estatística é qualquer função real mensurável da amostra de uma variável aleatória.
O conceito de estatístico é um conceito de estatística avançada. A definição é curta e definitivamente abstrata. É um conceito muito amplo, mas, como veremos a seguir, muito simples.
Dada a dificuldade do termo, faremos a descrição em partes. Assim, em primeiro lugar, será necessário descrever o que queremos dizer com uma função real mensurável. E, na segunda instância, definir o que entendemos como uma amostra de uma variável aleatória.
Uma estatística é uma função real mensurável
Quando nos referimos a uma função, estamos falando de uma função matemática. Por exemplo:
Y = 2X
De acordo com os valores que X assume, então Y assumirá um ou outro valor. Suponha que X valha 2. Então, Y valerá 4, o resultado da multiplicação de 2 por 2. Se X vale 3, então Y valerá 6. Resultado da multiplicação de 2 por 3.
Claro, um estatístico não é qualquer função. É uma função real e mensurável. Este conceito matemático é francamente simples. Real porque dá origem a números reais e mensuráveis porque pode ser medido.
As estatísticas têm inúmeras aplicações na vida cotidiana. Portanto, faz sentido que os valores que uma estatística pode produzir sejam reais e mensuráveis.
Amostra de uma variável aleatória
Já ouvimos muitas vezes o conceito de amostra. Ou o conceito de uma amostra representativa. Para este caso, não faremos distinção entre os diferentes tipos de amostra. Assim, usaremos o conceito de amostra em sentido amplo.
Vamos imaginar que queremos saber o gasto médio das famílias mexicanas com a compra de roupas. Obviamente, não temos recursos suficientes para perguntar a toda a população mexicana. Que fazemos? Nós o estimamos por meio de uma amostra. Uma amostra de, por exemplo, 50.000 famílias.
Essa amostra, tudo que se diz, terá que atender a características específicas. Ou seja, deve ser representativo e conter muitas famílias de diferentes áreas geográficas, diferentes gostos, religiões ou poder aquisitivo. Caso contrário, não obteremos um valor confiável.
Uma variável aleatória
Agora é uma amostra, mas uma amostra de uma variável aleatória. O que queremos dizer com variável aleatória? Uma variável aleatória, em palavras simples, é uma variável difícil de prever. Ou seja, em condições semelhantes, assume valores diferentes.
Por exemplo, o número que será lançado quando você lançar um dado é uma variável aleatória. Embora sempre o lancemos em condições muito semelhantes, obteremos resultados diferentes.
Agora que entendemos a definição técnica do conceito, temos que juntar tudo o que aprendemos. Nós sabemos o que é uma função real e mensurável. E, também sabemos qual é a amostra de uma variável aleatória.
Como apesar de tudo, o conceito continua abstrato, a melhor forma de entendê-lo será com um exemplo.
Exemplo estatístico
Suponha que haja 100 alunos em uma escola. Um professor nos propõe como atividade, tentar estimar qual é a nota média dos alunos daquela escola na disciplina de matemática.
Como não temos tempo ou recursos para perguntar aos 100 alunos, decidimos perguntar a 10 alunos. A partir daí, tentaremos estimar a nota média. Temos os seguintes dados:
Aluna | Observação | Aluna | Observação |
1 | 4 | 6 | 9 |
2 | 8 | 7 | 7 |
3 | 6 | 8 | 2 |
4 | 7 | 9 | 5 |
5 | 9 | 10 | 3 |
Antes de calcular a nota média, seguindo o propósito deste artigo, vamos aplicar o que aprendemos sobre estatística neste exemplo.
Sabemos que uma estatística é uma função real e mensurável da amostra de uma variável aleatória. Temos a amostra de uma variável aleatória (tabela acima). Com isso, qualquer função real e mensurável da referida amostra será uma estatística. Por exemplo:
Estatística 1: Aluno 1 + Aluno 2 + Aluno 3 +…. + Aluno 10 = 60
Estatística 2: Aluno 1 - Aluno 2 + Aluno 3 - Aluno 4 +… - Aluno 10 = 2
Estatística 3: -Aluno 1 - Aluno 2 - Aluno 3 -… .- Aluno 10 = -60
Essas três estatísticas são funções reais e mensuráveis da amostra. Com isso, eles são estatísticos. No nível teórico, tudo isso faz sentido. O sentido é que nem todas as estatísticas serão válidas para estimar de acordo com quais parâmetros.
Nesse ponto, entra o conceito de estimador. Um estimador é uma estatística para a qual certas condições serão necessárias para que ele possa calcular com segurança o parâmetro desejado.
Por exemplo, para estimar o parâmetro que conhecemos como “Nota média” ou “Nota média”, precisamos de um estimador. Conhecemos este estimador como “médio”. A média é um estimador. Ou seja, um estatístico que exige certas condições para poder calcular a nota média com certas garantias.
Se quisermos saber a nota média, teremos que somar todas as notas e dividir pelo número total de alunos. Quer dizer:
Nota média = (4 + 8 + 6 + 7 + 9 + 9 + 7 + 2 + 5 + 3) / 10 = 6
A fórmula da média é a mesma, qualquer que seja a amostra. Sempre use todos os dados que a amostra contém. Neste caso, temos dados de 10 alunos e a fórmula média usa todos os 10 dados. Se tivéssemos 20 dados de 20 alunos, usaríamos todos os 20. As estatísticas que atendem a essa característica são conhecidas como estatísticas suficientes.
Em conclusão, uma estatística é qualquer função real e mensurável de uma amostra. Uma vez que você tenha várias estatísticas possíveis, certas condições são necessárias para poder considerá-las como estimadores. E, graças aos estimadores, podemos tentar "prever" certos valores de amostras menores.