Il Tau di Kendall (II) - Che cos'è, definizione e concetto

È una misura di dipendenza non parametrica che identifica le coppie concordanti e discordanti di due variabili. Una volta individuati, si calcolano i totali e si fa il quoziente.

In altre parole, assegniamo una classifica alle osservazioni di ciascuna variabile e studiamo la relazione di dipendenza tra due variabili date.

Ci sono due modi per calcolare il Tau di Kendall; scegliamo di calcolare la relazione di dipendenza una volta ordinate le osservazioni di ciascuna variabile. Nel nostro esempio, vedremo che ordiniamo le classifiche nella colonna X in ordine crescente.

Le correlazioni classificate sono un'alternativa non parametrica come misura della dipendenza tra due variabili quando non possiamo applicare il coefficiente di correlazione di Pearson.

Questi sono i risultati a cui abbiamo fatto riferimento nel primo articolo -> Tau di Kendall (I):

Stazione sciistica (io) X Z C NC
PER 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
E 5 7 4 1
F 6 6 4 1
G 7 5 43 3 TOTALE
  • La coppia BC-CB è una coppia discordante. Inseriamo 1 nella colonna NC e congeliamo il contatore nell'ultima posizione finché non troviamo nuovamente una coppia corrispondente. In questo caso, abbiamo congelato il numero di coppie corrispondenti a 5 fino alla stazione D. La stazione D può formare solo 4 coppie corrispondenti: AD-DA, DE-ED, DF-FD, DG-GD.

Un'altra coppia discordante sarebbe EF-FE:

  • La coppia EF-FE è una coppia discordante. Scriviamo 1 nella colonna NC e continuiamo a trascinare il numero 4 di coppie concordanti che si possono formare. Le coppie corrispondenti della stazione E sarebbero: EA-AE, EB-BE, EC-CE, ED-DE perché EF-FE è discordante.
    • La coppia FG-GF è una coppia discordante. Scriviamo 1 nella colonna NC e continuiamo a trascinare il numero 4 di coppie concordanti che si possono formare. Le coppie concordanti della stazione F s (non abbiamo variato le invece di 4. Le coppie concordanti che potremmo mostrare prima (non abbiamo variato le sarebbero: FA-AF, FB-BF, FC-CF, FD-DF perché FG-GF è stridente.

Calcoliamo il Tau di Kendall

Il Tau di Kendall non ha segreti oltre ad essere il quoziente delle coppie concordanti e discordanti di un campione di osservazioni.

Interpretazione

La nostra domanda iniziale era: esiste una relazione di dipendenza tra le preferenze degli sciatori alpini e degli sciatori nordici in determinate stazioni sciistiche?

In questo caso, abbiamo una dipendenza tra le due variabili di 0,8695. Un risultato molto vicino al limite massimo. Questo risultato ci dice che gli sciatori alpini (X) e gli sciatori nordici (Z) hanno classificato le località con classificazioni simili.

Senza dover fare alcun tipo di calcolo, possiamo vedere che le prime stazioni (A, B, C) ricevono i migliori punteggi dai due gruppi. In altre parole, le valutazioni degli sciatori seguono la stessa direzione.

Confronto: Pearson vs Kendall

Se calcoliamo il coefficiente di correlazione di Pearson date le osservazioni precedenti e lo confrontiamo con il Tau di Kendall, otteniamo:

In questo caso, il Tau di Kendall ci dice che esiste una relazione di dipendenza più forte tra le variabili X e Z rispetto al coefficiente di correlazione di Pearson: 0,8695> 0,75.

Se i valori anomali avessero molta influenza sui risultati, troveremmo una grande differenza tra Pearson e Spearman e, quindi, dovremmo usare Spearman come misura della dipendenza.

Aiuterete lo sviluppo del sito, condividere la pagina con i tuoi amici

wave wave wave wave wave