Kendall's Tau (I) - Che cos'è, definizione e concetto

Sommario:

Kendall's Tau (I) - Che cos'è, definizione e concetto
Kendall's Tau (I) - Che cos'è, definizione e concetto
Anonim

È una misura di dipendenza non parametrica che identifica le coppie concordanti e discordanti di due variabili. Una volta individuati, si calcolano i totali e si fa il quoziente.

Le correlazioni classificate sono un'alternativa non parametrica come misura della dipendenza tra due variabili quando non possiamo applicare il coefficiente di correlazione di Pearson.

In altre parole, assegniamo una classifica alle osservazioni di ciascuna variabile e studiamo la relazione di dipendenza tra due variabili date. Ci sono due modi per calcolare il Tau di Kendall; scegliamo di calcolare la relazione di dipendenza una volta ordinate le osservazioni di ciascuna variabile. Nel nostro esempio, vedremo che abbiamo ordinato le classifiche nella colonna X in ordine crescente.

Matematicamente,

Definiamo:

Cn = numero totale di coppie corrispondenti.

NCn = numero totale di coppie non concordanti (discordanti).

Procedura ed esempio pratico

Per ottenere il Tau di Kendall, dobbiamo prima sapere come identificare le coppie concordanti e discordanti di due variabili.

Useremo le preferenze degli sciatori. In questo esempio assumiamo di voler valutare se gli sciatori classificano le loro preferenze per lo sci alpino o lo sci nordico nello stesso ordine in una stazione i. Le loro valutazioni possono variare da 1 (molto preferibile) a 7 (poco preferibile).

La nostra domanda sarebbe: c'è una dipendenza tra le preferenze degli sciatori alpini e degli sciatori nordici nelle località sciistiche date?

Definiamo:

X = valutazione degli sciatori per lo sci alpino nella stazione i.

Y = valutazione degli sciatori per lo sci nordico presso la stazione i.

C = coppie concordanti.

NC = coppie non corrispondenti/discordanti.

Eio = stazione sciistica i.

Processi

  • Partiamo da un campione di n = 7 osservazioni sulle stazioni sciistiche. Ogni riga della tabella sono le classificazioni fornite dagli sciatori. Ogni coppia di stazioni può essere concordante o discordante. Nelle colonne C e NC contiamo le coppie solo in una direzione. Ad esempio, la coppia AB e BA vengono conteggiate come una singola coppia per evitare ripetizioni.

Le osservazioni ottenute sono:

Stazione sciistica (io) X Z
PER 1 1
B 2 3
C 3 4
D 4 2
E 5 7
F 6 6
G 7 5
  1. Abbiamo ordinato gli elementi della colonna X in ordine crescente per poterli confrontare con gli elementi della colonna Z
  2. Troviamo le coppie concordanti e le coppie discordanti.
Stazione sciistica (io) X Z CNC
PER 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
E 5 7 4 1
F 6 6 4 1
G 7 5 43 3 Totale
  • Per prima cosa esaminiamo la colonna Z poiché la colonna X è già ordinata in ordine crescente. Di conseguenza, tutte le classificazioni nella colonna Z che non sono ascendenti saranno coppie di stazioni discordanti.
    • Quando cerchiamo coppie di stazioni (concordanti e non concordanti) avremo sempre l'ultima riga di osservazioni perché stiamo cercando coppie (insiemi di due osservazioni).
    • Tutti quelli che sono al di sotto di una classificazione di riferimento saranno coppie concordanti. Nel primo caso entrambi gli sciatori stabiliscono quella classifica di riferimento a 1. Tutte le classifiche inferiori a 1 saranno coppie concordanti con A. In totale abbiamo 7 stazioni da classificare. Quindi, ci saranno 6 coppie concordanti di A. Poiché non abbiamo coppie discordanti associate ad A, metteremo uno zero.

Leggi la seconda parte del Tau di Kendall (II)