Modelo de probabilidade linear

Índice:

Anonim

O modelo de probabilidade linear é um modelo de escolha binária. Nesse caso, a expectativa condicional da variável dependente é uma função linear, ou seja, a relação da variável dependente com a (s) variável (s) explicativa (s) é constante.

Para ver de outra forma, o modelo de probabilidade linear é um modelo onde temos uma variável dependente e uma variável independente (s) multiplicada por um (s) coeficiente (s) permanente (s).

Devemos ressaltar que o modelo de probabilidade linear é um modelo de escolha binária, ou seja, onde a variável dependente pode assumir dois valores. Esses valores são 1 ou 0, para indicar sucesso ou falha, respectivamente.

O modelo de probabilidade linear é expresso da seguinte forma:

E (Y | X = x) = Pr (Y = 1 | X = x) = p (x) = β0 + β1x

Na equação mostrada, a expectativa condicional de Y dado X é interpretada como igual a β0 + β1x.

Nesse caso, tomamos a expectativa condicional, uma vez que nos interessa saber a probabilidade de um indivíduo tomar uma decisão dadas as suas características, por exemplo (ou outra variável independente pode ser tomada como referência).

Desvantagens do modelo de probabilidade linear

Algumas desvantagens do modelo de probabilidade linear são as seguintes:

  • O modelo de probabilidade linear pode mostrar heteroscedasticidade. Quer dizer, a variância dos erros não é a mesma em todas as observações feitas. Nesse caso, erros padrão são usados.
  • Não se pode presumir que os erros sejam normalmente distribuídos.
  • A variável dependente pode assumir apenas dois valores.
  • Supõe-se que as variáveis ​​independentes e dependentes tenham uma relação linear, ou seja, a taxa de variação é sempre a mesma. No entanto, pode ser mais preciso construir um modelo em que a taxa de mudança aumenta à medida que Y atinge um valor mais alto e o oposto acontece quando Y diminui.

Dadas essas desvantagens, existem os modelos logit e probit.

Exemplo de um modelo de probabilidade linear

Um modelo de probabilidade linear pode ser construído, por exemplo, onde a variável dependente é se a pessoa atualmente tem um emprego formal que ocupou por um ano ou mais. As variáveis ​​independentes podem ser o nível de estudos ou escolaridade, sexo e idade.

No exemplo mostrado, a variável dependente será 1 ou 0, mas deve ser interpretada qualitativamente, independentemente de seu valor numérico. Assim, 1 significa que a pessoa possui sim um emprego formal que o mantém há mais de 1 ano, e 0 seria a situação em que isso não ocorre.