Modelos de escolha binária são modelos em que a variável dependente assume apenas dois valores: 1 para indicar "sucesso" ou "0" para indicar falha. Os modelos de estimação concretos são: probabilidade linear, logit e probit.
No modelo de regressão simples ou múltipla que é ensinado no curso introdutório à Econometria, a variável dependente geralmente tem uma interpretação econômica (como o aumento do PIB, investimento ou consumo) de outras variáveis explicativas.
Mas que modelo usamos quando queremos explicar eventos que têm apenas duas possibilidades? Por exemplo: ser aprovado ou não aprovado, se formar ou não se formar, estar empregado ou desempregado, etc. É a isso que os modelos de escolha binária respondem.
Em cada um desses casos, você pode fazer Y = 1 denota "sucesso"; Y = 0 denotam "falha". Por esta razão, eles são chamados de modelos de escolha binária e a equação que usa é assim:
Desta forma, obteremos a probabilidade de sucesso de uma determinada variável.
Até agora, não houve nenhuma complicação importante. No entanto, a estimação e interpretação dos parâmetros requerem maior cuidado.
Modelo de regressãoModelos para estimar parâmetros binários
Dadas as características acima mencionadas da variável independente, existem três modelos para estimar os parâmetros:
- Modelo de probabilidade linear. É calculado por meio de OLS normal.
- Modelo Logit. É calculado com uma função de distribuição logística padrão.
- Modelo Probit. É calculado com uma função de distribuição normal padrão.
Modelo de probabilidade linear
O modelo de probabilidade linear (MPL) é assim chamado porque a probabilidade
a resposta é linear em relação aos parâmetros da equação. Para a estimativa, use mínimos quadrados ordinários (OLS)
A equação estimada é escrita
A variável independente (e chapéu) é a probabilidade de sucesso prevista.
O B0 cap é a probabilidade de sucesso prevista quando cada um dos x é igual a zero. O coeficiente B1 cap mede a variação da probabilidade de sucesso prevista quando x1 aumenta uma unidade.Para interpretar corretamente um modelo de probabilidade linear, devemos levar em consideração o que é considerado um sucesso e o que não é.
Exemplo de modelo de escolha binária
O economista Jeffrey Wooldridge estimou um modelo econométrico onde a variável binária indica se uma mulher casada participava da força de trabalho (variável explicada) durante 1975. Neste caso Y = 1 significa que e participou Y = 0 que não o fez.
O modelo usa o nível de renda do marido como variáveis explicativas (Hinc), Anos de educação (educ), anos de experiência no mercado de trabalho (exper), idade (era), o número de crianças menores de seis anos (kidslt6) e o número de crianças entre 6 e 18 anos (kidsge6).
Podemos verificar que todas as variáveis, exceto kidsge6, são estatisticamente significativas e todas as variáveis significativas têm o efeito esperado.
Agora, a interpretação dos parâmetros é assim:
- Se você aumentar um ano de escolaridade, ceteris paribus, a probabilidade de entrar na força de trabalho aumenta 3,8%.
- Se a experiência aumentar em um ano, a probabilidade de fazer parte da força de trabalho aumenta em 3,9%.
- Se você tem um filho com menos de 6 anos de idade, ceteris paribus, a probabilidade de fazer parte da força de trabalho diminui em 26,2%.
Então, vemos que esse modelo nos informa o efeito de cada situação na probabilidade de uma mulher ser formalmente contratada.
Este modelo pode ser usado para avaliar políticas públicas e programas sociais, uma vez que a mudança na “probabilidade de sucesso prevista” pode ser quantificada em relação a mudanças unitárias ou marginais nas variáveis explicativas.
Desvantagens do modelo de probabilidade linear
No entanto, este modelo tem duas desvantagens principais:
- Ele pode fornecer probabilidades menores que zero e maiores que um, o que não faz sentido em termos de interpretação desses valores.
- Os efeitos parciais são sempre constantes. Nesse modelo, não há diferença entre passar de zero filho para um filho, do que passar de dois para três filhos.
- Como a variável explicativa assume apenas valores de zero ou um, a heterocedasticidade pode ser gerada. Erros padrão são usados para resolver isso.
Para resolver os dois primeiros problemas, que são os mais importantes no modelo de probabilidade linear, os modelos Logit e Probit foram projetados.
Referências:
Wooldridge, J. (2010) Introdução à Econometria. (4ª ed.) México: Cengage Learning.