Variável dummy - O que é, definição e conceito - 2021

Uma variável dummy é uma variável usada para explicar valores qualitativos em um modelo de regressão.

Os modelos de regressão tentam explicar uma variável em termos de outras. Por exemplo, o salário de uma pessoa com base em sua idade, educação e experiência. Essas variáveis ​​podem ser quantificadas. A idade, educação e experiência de uma pessoa podem ser quantificadas em número de anos. Mas o que acontece quando temos variáveis ​​que não podem ser quantificadas? Por exemplo, cor do cabelo, país onde você mora ou sexo. A solução para este problema está nas variáveis ​​dummy. São variáveis ​​que geralmente assumem valores binários. Ou seja, valor zero ou um.

Por exemplo, a variável sexo, já dissemos, é uma variável qualitativa. Para incluí-lo em um modelo de regressão, você deve criar uma variável fictícia. Chamaremos a variável de "mulher" de forma que:

Mulher = 1 (se o indivíduo for mulher)

Mulher = 0 (se o indivíduo não é mulher, ou seja, é homem)

Nesse caso, "homem" é considerado uma categoria de referência ou grupo de base.

Existem dois tipos de variáveis ​​dummy. Por um lado, existem as variáveis ​​dummy aditivas e, por outro lado, existem as variáveis ​​dummy multiplicativas.

Análise de regressão

Variável dummy aditiva

Uma variável fictícia aditiva coleta uma mudança fixa. Essa mudança afeta apenas o termo constante da equação. Por exemplo, um modelo que visa explicar salários com base no sexo e anos de escolaridade. Podemos colocar a equação tomando como referência os homens (segunda equação) ou tomando como referência as mulheres (primeira equação):

A representação gráfica das equações seria: Caso os homens tenham salários maiores, tomando uma variável dummy aditiva, o modelo seria representado como a imagem anterior.

No seu caso, se as mulheres tivessem salários maiores do que os homens, tomando uma variável dummy aditiva, o modelo seria representado graficamente como a imagem anterior.

A diferença quantitativa entre a linha azul (homens) e a linha laranja (mulheres) será igual ao valor da variável «Mulheres" ou "Homens»Conforme modelo escolhido. Nesse caso, das variáveis ​​dummy aditivas, a diferença salarial independe do nível de estudos. Ou seja, a diferença salarial depende única e exclusivamente do sexo.

Variável fictícia multiplicativa

Uma variável dummy multiplicativa captura uma mudança na inclinação das equações para homens e mulheres. Continuando com o exemplo anterior, temos:

Graficamente, uma possível representação seria:

Nesse caso, o modelo estaria nos dizendo duas coisas. Em primeiro lugar, os salários das mulheres são inferiores aos dos homens. E, em segundo lugar, que um ano adicional de educação paga melhor para os homens do que para as mulheres. Sabemos disso porque a inclinação da linha azul (homens) é maior do que a inclinação da linha laranja (mulheres).

Se um ano adicional de educação fosse melhor pago às mulheres, a inclinação da linha laranja (mulheres) seria maior. E, a linha azul (homens) ficaria abaixo.

Variável estatística

Você vai ajudar o desenvolvimento do site, compartilhando a página com seus amigos

wave wave wave wave wave