Viés de sobrevivência - O que é, definição e conceito

Índice:

Anonim

O viés de sobrevivência é um viés que ocorre na coleta de dados quando os dados são excluídos da análise porque não existem mais hoje.

Esse viés surge em uma ampla variedade de contextos em que nos concentramos apenas nos dados “sobreviventes”. Um exemplo disso é visto quando as empresas pesquisam seus clientes sobre um de seus produtos. Mas eles deixam seus não clientes, que neste caso seriam os “não sobreviventes”, no esquecimento.

Nesse caso, tirar conclusões desse estudo seria errado. Uma vez que os resultados seriam tendenciosos apenas para a população "sobrevivente". E não seriam resultados representativos.

Viés de sobrevivência na prática

Um exemplo claro desse viés pode ser visto no estudo de resultados de fundos de investimento. Onde a maioria dos bancos de dados inclui apenas fundos que existem hoje. Independentemente dos fundos que existiam no passado.

A razão pela qual eles não existem hoje é porque seu desempenho tem sido pior do que o dos “sobreviventes”. Ou mesmo vários fundos foram fundidos em um. Portanto, a análise está sendo feita sobre os fundos com melhores resultados. E esse viés tende a superestimar o desempenho da amostra desses fundos.

O principal problema com isso não é mais apenas a superestimação do desempenho do fundo. Em vez disso, a amostra selecionada não seria uma amostra aleatória da população total. E, portanto, os resultados do estudo podem não ser representativos da população. Isso no final é o que procuramos ao selecionar uma amostra aleatória da população.

Solução para o viés de sobrevivência

Vamos imaginar que queremos selecionar um fundo de investimento para investir, com base em seu comportamento anterior. Para evitar esse viés de sobrevivência e otimizar essa seleção, devemos realizar as seguintes etapas:

  • Escolha o horizonte de tempo com o qual planejamos trabalhar. Por exemplo, dez, quinze ou vinte anos de história.
  • Pegue todos os fundos existentes desde o início do horizonte de tempo, existam ou não no momento.
  • A partir daí, selecione a amostra daquela população para o estudo do comportamento.

A ideia disso, no final das contas, é obter aquela amostra aleatória da população. E a partir daí, as conclusões obtidas, se pudessem ser representativas daquela população.