O erro do tipo 1 nas estatísticas é definido como a rejeição da hipótese nula quando ela é realmente verdadeira. Um erro do tipo 1 também é conhecido como falso positivo ou erro do tipo alfa.
Cometer um erro do tipo 1 é basicamente negar algo quando na verdade é verdade. Considere, por exemplo, a situação de testar se uma campanha de marketing realizada nas redes sociais aumenta as vendas de sorvete de uma empresa em uma semana de verão. As hipóteses seriam as seguintes:
H0: As vendas não estão aumentando devido à campanha de verão
H1: Aumento de vendas devido à campanha de marketing
Após avaliação do tráfego do site da empresa e das páginas visitadas após a campanha, é detectado o seguinte:
- Aumento embora no tráfego e visitas de 50%.
- Aumento de 200% nas vendas de sorvetes.
Diante desses resultados, pode-se concluir que a campanha publicitária tem sido frutífera e repercutiu no aumento das vendas. Porém, vamos pensar que naquela semana houve uma onda de calor trazendo as temperaturas acima de 40 graus.
Sabendo disso, teríamos que levar em consideração o fator de alta temperatura como causa do aumento das vendas. Se não levarmos isso em conta, poderemos rejeitar nossa hipótese nula quando for verdadeira, ou seja, estaríamos pensando que nossa campanha foi um sucesso retumbante quando na realidade a causa do aumento das vendas foi o forte calor. Se chegássemos a essa conclusão, estaríamos rejeitando a hipótese nula quando ela fosse realmente verdadeira e, portanto, cometendo um erro do tipo 1.
Causas do erro tipo 1
O erro tipo 1 está relacionado à significância do contraste ou alfa, com o erro da estimativa dos coeficientes e pode ocorrer devido a 2 violações típicas das suposições iniciais de uma regressão. Estes são:
- Heterocedasticidade condicional.
- A correlação serial.
Uma regressão que apresentasse qualquer uma das violações anteriores subestimaria o erro dos coeficientes. Se isso acontecer, nossa estimativa da estatística t seria maior do que a estatística t real. Esses valores maiores da estatística t aumentariam a probabilidade de que o valor caia na zona de rejeição.
Vamos imaginar 2 situações.
Situação 1 (estimativa de erro incorreta)
- Significado: 5%
- Tamanho da amostra: 300 pessoas.
- Valor crítico: 1,96
- B1: 1,5
- Erro de estimativa de coeficiente: 0,5
T = 1,5 / 0,5 = 3
Dessa forma, o valor cairia na zona de rejeição e estaríamos rejeitando a hipótese nula.
Situação 2 (estimativa de erro correta)
- Significado: 5%
- Tamanho da amostra: 300 pessoas.
- Valor crítico: 1,96
- B1: 1,5
- Erro de estimativa de coeficiente: 1
T = 1,5 / 1 = 1,5
Dessa forma, o valor cairia na zona de não rejeição e não estaríamos rejeitando a hipótese.
Com base nos exemplos anteriores, a situação 1 em que o erro está subestimado, nos levaria a rejeitar a hipótese nula quando na verdade ela é verdadeira, pois como vemos na situação 2 com o erro estimado corretamente, não estaríamos rejeitando a hipótese sendo verdade.