Estatística suficiente - O que é, definição e conceito
Uma estatística suficiente para um parâmetro Θ é aquela capaz de coletar ou resumir todas as informações que a amostra de uma variável aleatória X contém.
Sabemos que uma estatística é uma função real da amostra. Ou seja, leva valores reais contidos na amostra. A partir daí, como vimos no artigo em que o conceito de estatística é definido, devemos garantir que o estatístico tenha certas propriedades. Por que exigir tais propriedades? Para garantir que a estatística seja útil para nossos propósitos.
A suficiência é uma dessas propriedades. De uma forma muito mais simples, diremos que uma estatística é suficiente se usar todas as informações contidas na amostra.
Como saber se uma estatística é suficiente?
Logicamente, a questão que se coloca é: Como posso saber se uma estatística T atende à propriedade de suficiência? Ou Como posso encontrar, se houver, uma estatística que atenda à propriedade suficiência. A resposta a essas duas perguntas é encontrada em dois teoremas:
- Critério de fatoração de Fisher-Neyman: Esse critério afirma que, dada uma estatística T, se ela atender a certas condições, será uma estatística suficiente.
- Teorema de Darmois: Este teorema responde à segunda pergunta. Ou seja, permite-nos encontrar uma estatística suficiente por meio de uma série de procedimentos.
Exemplo de estatística suficiente
Suponha que desejemos calcular a renda média anual das famílias que residem no Chile. Para fazer isso, seguiremos o seguinte processo:
- Colete informações (amostra): Como não podemos perguntar a cada uma das famílias que residem no Chile quanto ganham anualmente, tomaremos uma amostra representativa de, por exemplo, 1.000 famílias.
- Identifique a variável aleatória em estudo: A variável aleatória em estudo é a renda familiar. Assim: X → Renda familiar
- Escolha a estatística certa: A estatística apropriada para calcular a renda média não é outra senão a expectativa de X. Em outras palavras, a média da amostra de X.
- Como posso saber se a estatística média da amostra é uma estatística suficiente? Como já temos a expressão matemática da estatística, usaremos o critério de fatoração de Fisher-Neyman. Ou o Teorema de Darmois. São fórmulas criadas para esse fim.
Depois de aplicar os cálculos adequados, concluímos que a estatística média da amostra atende ao requisito ou propriedade de suficiência. Ao garantir que cumpre este requisito, estamos a assegurar que esta função (estatística), que nos permite sintetizar a informação (rendimento médio), utiliza toda a informação contida na amostra (as 1.000 famílias).
Por que é importante usar todas as informações da amostra?
Agora que sabemos que a média da amostra é uma estatística suficiente, vamos supor um caso. Que sentido faria querer calcular a renda média com base nessas 1.000 famílias chilenas e usar apenas os dados de 500 famílias?
Claro, não faria nenhum sentido. Queremos um resumo de todas as informações. Ou seja, o que definimos como estatística suficiente.