Interação entre variáveis ​​independentes binárias

Índice:

Anonim

A interação entre variáveis ​​independentes em uma regressão múltipla ocorre quando o efeito parcial na variável dependente de uma variável independente depende de outra variável independente da regressão.

Em outras palavras, queremos quantificar a relação de dependência entre as variáveis ​​independentes quando uma delas afeta parcialmente a variável dependente do modelo.

O ponto de partida é uma regressão múltipla.

Procedimento e exemplo

Queremos estudar o preço de passes de esqui(passes de esquieu) dependendo da qualidade da neve (neveeu) e o nível dos esquiadores (níveleu) Trataremos essas variáveis ​​qualitativas como variáveis ​​dummy ou binárias. Quer dizer:

neveeu = qualidade de neve muito boa => neveeu=1.

neveeu = qualidade de neve muito baixa => neveeu=0.

níveleu = nível de esquiadores alto => níveleu=1.

níveleu = nível de esquiadores baixo => níveleu=0.

Então,

Modelo 1

H.H1 = é o efeito parcial da qualidade da neve muito boa (neveeu= 1) over log (passes de esquieu), mantendo o nível dos esquiadores constante (níveleu).

H.H2 = é o efeito parcial do alto nível dos esquiadores (níveleu= 1) over log (passes de esquieu), mantendo a qualidade da neve constante (neveeu).

O modelo 1 tem uma limitação importante: manter uma das variáveis ​​dummy do modelo constante implica que:

níveleu= constante => Não fazemos distinção entre alto nível (níveleu= 1) ou baixo (níveleu=0).

neveeu= constante => Não fazemos distinção entre muito boa qualidade (neveeu= 1) ou muito ruim (neveeu=0).

Além dessa limitação, podemos modificar a regressão para que haja uma interação (dependência) entre as variáveis ​​independentes que possam diferenciar os dois valores que assume a variável independente constante.

Matematicamente, pode-se considerar que o efeito parcial de neveeu sobre log (passes de esquieu) guardando níveleu constante depende do valor que leva níveleu. No caso de níveleu pode ser que o efeito parcial de níveleusobre log (passes de esquieu) guardando neveeu constante depende do valor que leva neveeu.

Esquematicamente

Se houver uma interação entreníveleu Yneveeu, então quandoníveleu é constante, podemos diferenciar entre nível alto ou baixo. Desta forma, o preço depasses de esqui quando a qualidade da neve é ​​muito boa (neveeu= 1) será diferente dependendo se o nível dos esquiadores é alto ou baixo.

Se houver uma interação entreníveleu Yneveeuentão quando nevaeué constante que podemos diferenciar entre neve muito boa ou muito ruim. Desta forma, o preço depasses de esquiquando o nível dos esquiadores é alto (níveleu= 1) será diferente dependendo se a neve é ​​muito boa ou muito ruim.

Como traduzimos essa interação em regressão? Incorporando o termo de interação.

O termo de interação é:

(neveeu · níveleu )

Essa nova regressão que incorpora variáveis ​​independentes binárias e o termo de interação é chamada de modelo de regressão de interação de variável binária.