Um intervalo de confiança é uma técnica de estimação utilizada em inferência estatística que permite limitar um par ou vários pares de valores, dentro dos quais se encontrará a estimativa pontual desejada (com uma certa probabilidade).
Um intervalo de confiança nos permitirá calcular dois valores em torno de uma média da amostra (um superior e um inferior). Esses valores limitarão uma faixa dentro da qual, com certa probabilidade, o parâmetro da população estará localizado.
Intervalo de confiança = média + - margem de erro
Conhecer a verdadeira população, em geral, é algo muito complicado. Considere uma população de 4 milhões de pessoas. Podemos saber o gasto médio de consumo por domicílio dessa população? Em princípio, sim. Teríamos simplesmente que pesquisar todas as famílias e calcular a média. No entanto, seguir esse processo seria extremamente trabalhoso e tornaria o estudo bastante complicado.
Em situações como essa, é mais viável selecionar uma amostra estatística. Por exemplo, 500 pessoas. E na referida amostra, calcule a média. Embora ainda não saibamos o verdadeiro valor da população, podemos supor que será próximo ao valor da amostra. A isso significa que adicionamos a margem de erro e temos um valor de intervalo de confiança. Por outro lado, subtraímos essa margem de erro da média e teremos outro valor. Entre esses dois valores estará a média da população.
Em conclusão, o intervalo de confiança não serve para dar uma estimativa pontual do parâmetro populacional, se nos vai ajudar a ter uma ideia aproximada de qual poderia ser o verdadeiro. Isso nos permite limitar entre dois valores onde a média da população será encontrada.
Coeficiente de variaçãoFrequência acumulativaFatores dos quais um intervalo de confiança depende
O cálculo de um intervalo de confiança depende principalmente dos seguintes fatores:
- Tamanho da amostra selecionada: Dependendo da quantidade de dados que foi usada para calcular o valor da amostra, ele será mais ou menos próximo do verdadeiro parâmetro da população.
- Nível de confiança: Ele nos informará em qual porcentagem de casos nossa estimativa está correta. Os níveis usuais são 95% e 99%.
- Margem de erro de nossa estimativa: Isso é chamado de alfa e nos informa sobre a probabilidade de que o valor da população esteja fora de nossa faixa.
- O estimado na amostra (média, variância, diferença de médias …): A estatística dinâmica para calcular o intervalo dependerá disso.
Exemplo de intervalo de confiança para a média, assumindo normalidade e o desvio padrão conhecido
A estatística dinâmica usada para o cálculo seria a seguinte:
O intervalo resultante seria o seguinte:
Vemos como no intervalo à esquerda e à direita da desigualdade temos os limites inferior e superior, respectivamente. Portanto, a expressão nos diz que a probabilidade de que a média da população esteja entre esses valores é 1-alfa (nível de confiança).
Vamos dar uma olhada melhor no acima com um exercício resolvido como exemplo.
Você deseja estimar o tempo médio que um corredor leva para completar uma maratona. Para isso, foram cronometradas 10 maratonas e obtida uma média de 4 horas com desvio padrão de 33 minutos (0,55 horas). Você deseja obter um intervalo de confiança de 95%.
Para obter o intervalo, teríamos apenas que substituir os dados na fórmula do intervalo.
O intervalo de confiança seria a parte da distribuição sombreada em azul. Os 2 valores limitados por isso seriam aqueles correspondentes às 2 linhas vermelhas. A linha central que divide a distribuição em 2 seria o valor real da população.
É importante notar que neste caso, dado que a função densidade da distribuição N (0,1) nos dá a probabilidade cumulativa (da esquerda para o valor crítico), temos que encontrar o valor que nos deixa 0,975 no o% esquerdo (isto é 1,96).