Tau (II) de Kendall - O que é, definição e conceito

Índice:

Anonim

É uma medida de dependência não paramétrica que identifica os pares concordantes e discordantes de duas variáveis. Uma vez identificados, os totais são calculados e o quociente é feito.

Em outras palavras, atribuímos uma classificação às observações de cada variável e estudamos a relação de dependência entre duas variáveis ​​fornecidas.

Existem duas maneiras de calcular o Tau de Kendall; optamos por calcular a relação de dependência uma vez que as observações de cada variável tenham sido ordenadas. Em nosso exemplo, veremos que classificamos as classificações na coluna X em ordem crescente.

As correlações classificadas são uma alternativa não paramétrica como medida de dependência entre duas variáveis ​​quando não podemos aplicar o coeficiente de correlação de Pearson.

Estes são os resultados que referimos no primeiro artigo -> Tau (I) de Kendall:

Estação de esqui (eu) X Z C NC
PARA 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
E 5 7 4 1
F 6 6 4 1
G 7 5 43 3 TOTAL
  • O par BC-CB é um par discordante. Inserimos 1 na coluna NC e congelamos o contador na última posição até encontrarmos um par correspondente novamente. Nesse caso, congelamos o número de pares correspondentes em 5 até a estação D. A estação D pode formar apenas 4 pares correspondentes: AD-DA, DE-ED, DF-FD, DG-GD.

Outro par discordante seria EF-FE:

  • O par EF-FE é um par discordante. Escrevemos 1 na coluna NC e continuamos arrastando o número 4 de pares concordantes que podem ser formados. Os pares correspondentes da estação E seriam: EA-AE, EB-BE, EC-CE, ED-DE porque EF-FE é discordante.
    • O par FG-GF é um par discordante. Escrevemos 1 na coluna NC e continuamos arrastando o número 4 de pares concordantes que podem ser formados. Os pares concordantes da estação F s (não variamos o em vez de 4. Os pares concordantes que poderíamos mostrar antes (não variamos o seriam: FA-AF, FB-BF, FC-CF, FD-DF porque FG-GF é chocante.

Calculamos o Tau de Kendall

O Tau de Kendall não tem segredo além de ser o quociente dos pares concordantes e discordantes de uma amostra de observações.

Interpretação

Nossa pergunta inicial era: existe uma relação de dependência entre as preferências dos esquiadores downhill e dos esquiadores nórdicos em determinadas estações de esqui?

Nesse caso, temos uma dependência entre as duas variáveis ​​de 0,8695. Um resultado muito próximo do limite superior. Este resultado nos diz que os esquiadores alpinos (X) e os esquiadores nórdicos (Z) classificaram os resorts com classificações semelhantes.

Sem ter que fazer nenhum tipo de cálculo, vemos que as primeiras estações (A, B, C) recebem as melhores pontuações dos dois grupos. Em outras palavras, as avaliações dos esquiadores seguem a mesma direção.

Comparação: Pearson vs Kendall

Se calcularmos o coeficiente de correlação de Pearson dadas as observações anteriores e compará-lo com o Tau de Kendall, obtemos:

Nesse caso, o Tau de Kendall nos diz que há uma relação de dependência mais forte entre as variáveis ​​X e Z em comparação com o coeficiente de correlação de Pearson: 0,8695> 0,75.

Se os outliers tivessem muita influência nos resultados, encontraríamos uma grande diferença entre Pearson e Spearman e, portanto, deveríamos usar Spearman como uma medida de dependência.