Níveis de significância - O que é, definição e conceito

Índice:

Anonim

Os níveis de significância complementam o intervalo de confiança de uma distribuição e são usados ​​para testar a hipótese nula (H0) em um teste de inferência estatística.

Em outras palavras, os níveis de significância são as probabilidades que deixamos fora do intervalo de confiança de uma distribuição e nos ajudam a determinar se a estatística de teste está na zona de rejeição ou não.

Relação entre nível de significância e nível de confiança

Certamente todos nós já ouvimos alguém perguntar que valor devemos atribuir ao alfa da distribuição ou com que nível de confiança calculamos o intervalo, matematicamente, (1-alfa). A resposta geralmente é sempre 1%, 5% ou 10% para o alfa ou 99%, 95% e 90% para o nível de confiança.

É importante deixar claro o seguinte:

  • 1%, 5%, 10% = alfa => Níveis de significância.
  • 99%, 95%, 90% = (1-alfa) => Intervalo de confiança.

Os intervalos de confiança e os níveis de significância são complementares, pois a soma de ambos é a área da função densidade. Então,

Já sabemos que a área da função densidade é 1. Matematicamente, podemos resolver esta integral:

Representação do nível de significância

Nesse caso, a distribuição t de Student com 16 graus de liberdade foi usada para mostrar quais áreas da função pertencem aos níveis de significância. As percentagens (2,5%, 2,5% e 95%) correspondem à área sob a função densidade. Como essa distribuição tem duas caudas, o nível de significância é dividido pela metade, então 2,5% + 2,5% = 5%. O valor crítico desta distribuição com 16 graus de liberdade e 5% como nível de significância é 2,111991 em cada cauda.

2,5% + 2,5% + 95% = 1%

Universal

Rotulamos os níveis de significância como universais porque esses níveis são conhecidos e usados ​​em todos os testes estatísticos. É muito incomum encontrar um nível de significância de 20% ou 35%, a menos que seja uma condição de teste explícita.

É verdade que os níveis 1% e 5% são mais populares do que o nível 10%, mas é por razões de precisão. É melhor dar um resultado 1 em 100 vezes (1/100 = 0,01 = 1%) ou 5 em 100 vezes (5/100 = 0,05 = 5%) do que 10 em 100 vezes (10/100 = 0,1 = 10%), certo?

Além disso, os níveis de significância são chamados de percentil, por exemplo, percentil 1% ou percentil 5%. Essa nomenclatura é amplamente usada para calcular a métrica do valor em risco (VaR).

Arbitrário e não arbitrário

Os níveis de significância podem ser arbitrários e não arbitrários. Os arbitrários são os valores que escolhemos a priori (antes) conhecer as características do experimento. Nesse caso, seria antes de calcular a estatística de teste. Os não arbitrários são aqueles obtidos a partir do resultado do experimento. Nesse caso, o valor p, porque depende do valor obtido pela estatística de teste. Ambos dependem da distribuição que os dados seguem.