Os modelos Logit e Probit são modelos econométricos não lineares usados quando a variável dependente é binária ou dummy, ou seja, pode assumir apenas dois valores.
O modelo de escolha binária mais simples é o modelo de probabilidade linear. No entanto, existem dois problemas em usá-lo:
- As probabilidades obtidas podem ser menores que zero ou maiores que um,
- O efeito parcial sempre permanece constante.
Para contornar essas desvantagens, foram elaborados o modelo logit e o modelo probit, que utilizam uma função que assume apenas valores entre zero e um. Essas funções não são lineares e correspondem às funções de distribuição cumulativa.
Modelo Logit
No modelo Logit, a probabilidade de sucesso é avaliada na função G (z) = / (z) Onde
Esta é a função de distribuição cumulativa logística padrão.
Por exemplo, com esta função e esses parâmetros, obteríamos um valor de:
Lembre-se de que a variável independente é a probabilidade de sucesso prevista. O B0 indica a probabilidade de sucesso prevista quando cada um dos x é igual a zero. O coeficiente B1 cap mede a variação na probabilidade de sucesso prevista quando a variável x1 aumenta em uma unidade.
Modelo probit
No modelo Probit, a probabilidade de sucesso é avaliada na função G (z) =Φ (z) Onde
Esta é a função de distribuição cumulativa normal padrão.
Por exemplo, com esta função e esses parâmetros, obteríamos um valor de:
Efeitos Parciais em Logit e Probit
Para determinar o efeito parcial de x1 na probabilidade de sucesso, existem vários casos:
Para calcular o efeito parcial, cada variável deve ser substituída x para um valor específico, a média da amostra das variáveis é freqüentemente usada.
Métodos para estimar Logit e Probit
Mínimos quadrados não lineares
O estimador não linear de mínimos quadrados seleciona os valores que minimizam a soma dos resíduos quadrados
Em grandes amostras, o estimador de mínimos quadrados não linear é consistente, normalmente distribuído e geralmente menos eficiente do que a probabilidade máxima.
Máxima probabilidade
O estimador de máxima verossimilhança seleciona os valores de que maximizam o logaritmo da verossimilhança
Em grandes amostras, o estimador de máxima verossimilhança é consistente, normalmente distribuído e é o mais eficiente (porque tem a menor variância de todos os estimadores)
Utilidade dos modelos Logit e Probit
Como apontamos no início, os problemas do modelo de probabilidade linear são duplos:
- As probabilidades obtidas podem ser menores que zero ou maiores que um,
- O efeito parcial sempre permanece constante.
Os modelos logit e probit resolvem ambos os problemas: os valores (representando probabilidades) estarão sempre entre (0,1) e o efeito parcial mudará dependendo dos parâmetros. Assim, por exemplo, a probabilidade de uma pessoa estar envolvida em trabalho formal será diferente se ela for recém-formada ou se tiver 15 anos de experiência.
Referências:
Wooldridge, J. (2010) Introdução à Econometria. (4ª ed.) México: Cengage Learning.
Modelo de regressão