A interação entre variáveis independentes em uma regressão múltipla ocorre quando o efeito parcial na variável dependente de uma variável independente depende de outra variável independente da regressão.
Em outras palavras, queremos quantificar a relação de dependência entre as variáveis independentes quando uma delas afeta parcialmente a variável dependente do modelo.
O ponto de partida é uma regressão múltipla.
Procedimento e exemplo
Queremos estudar o preço de passes de esqui(passes de esquieu) dependendo da qualidade da neve (neveeu) e o nível dos esquiadores (níveleu) Trataremos essas variáveis qualitativas como variáveis dummy ou binárias. Quer dizer:
neveeu = qualidade de neve muito boa => neveeu=1.
neveeu = qualidade de neve muito baixa => neveeu=0.
níveleu = nível de esquiadores alto => níveleu=1.
níveleu = nível de esquiadores baixo => níveleu=0.
Então,
Modelo 1
H.H1 = é o efeito parcial da qualidade da neve muito boa (neveeu= 1) over log (passes de esquieu), mantendo o nível dos esquiadores constante (níveleu).
H.H2 = é o efeito parcial do alto nível dos esquiadores (níveleu= 1) over log (passes de esquieu), mantendo a qualidade da neve constante (neveeu).
O modelo 1 tem uma limitação importante: manter uma das variáveis dummy do modelo constante implica que:
níveleu= constante => Não fazemos distinção entre alto nível (níveleu= 1) ou baixo (níveleu=0).
neveeu= constante => Não fazemos distinção entre muito boa qualidade (neveeu= 1) ou muito ruim (neveeu=0).
Além dessa limitação, podemos modificar a regressão para que haja uma interação (dependência) entre as variáveis independentes que possam diferenciar os dois valores que assume a variável independente constante.
Matematicamente, pode-se considerar que o efeito parcial de neveeu sobre log (passes de esquieu) guardando níveleu constante depende do valor que leva níveleu. No caso de níveleu pode ser que o efeito parcial de níveleusobre log (passes de esquieu) guardando neveeu constante depende do valor que leva neveeu.
Esquematicamente
Se houver uma interação entreníveleu Yneveeu, então quandoníveleu é constante, podemos diferenciar entre nível alto ou baixo. Desta forma, o preço depasses de esqui quando a qualidade da neve é muito boa (neveeu= 1) será diferente dependendo se o nível dos esquiadores é alto ou baixo.
Se houver uma interação entreníveleu Yneveeuentão quando nevaeué constante que podemos diferenciar entre neve muito boa ou muito ruim. Desta forma, o preço depasses de esquiquando o nível dos esquiadores é alto (níveleu= 1) será diferente dependendo se a neve é muito boa ou muito ruim.
Como traduzimos essa interação em regressão? Incorporando o termo de interação.
O termo de interação é:
(neveeu · níveleu )
Essa nova regressão que incorpora variáveis independentes binárias e o termo de interação é chamada de modelo de regressão de interação de variável binária.