Una variabile categoriale è quella che consente di classificare una serie di dati mediante valori fissi associati a una specifica qualità o categoria.
La variabile categoriale, a differenza delle variabili cardinali o continue (che consentono calcoli numerici), classifica individui o casi. Normalmente prendono valori rappresentati da numeri interi, come uno o zero, ma queste sono proprio queste, rappresentazioni.
Nell'esempio lo vedremo più in dettaglio.
Differenze tra variabile categoriale e continua
Ci sono alcune differenze tra la variabile categoriale e la variabile continua o cardinale che dovrebbero essere note. Vediamo i più rilevanti.
- Innanzitutto, la variabile categoriale viene utilizzata per il raggruppamento e la variabile continua per il conteggio. In altre parole, la prima permette di formare categorie con una serie di dati. Ad esempio, sesso o numero di figli. Il secondo ci fornisce informazioni numeriche. Ad esempio, l'età.
- La variabile cardinale consente calcoli numerici, le altre no. In questo modo, nel primo possiamo conoscere le medie o le varianze, mentre negli altri solo alcuni dati, come la modalità o la percentuale delle categorie.
- Quelle categoriali sono molto utili per conoscere informazioni qualitative, cioè una certa qualità dei dati. Quelli continui ci forniscono dati quantitativi, cioè quantità e valori rappresentati da numeri.
Tecniche statistiche per variabili categoriali
Successivamente, vediamo le tecniche statistiche più utilizzate nelle variabili categoriali, confrontandole con quelle delle variabili continue o cardinali.
- Statistiche descrittive: In questo tipo di variabili, le analisi si basano solitamente su grafici a barre e percentuali, tra gli altri. I cardinali consentono l'applicazione di tecniche di analisi per calcolare statistiche di posizione come i quantili o statistiche di dispersione come le varianze.
- Ipotesi contrasto: Nella categoriale, i risultati possono essere estrapolati mediante test di ipotesi non parametrici. Quelle continue, invece, utilizzano contrasti parametrici che possono essere anche dedotti.
- Tecniche di regressione: In questo caso, per il primo, vengono utilizzate, tra le altre, la regressione logistica o simili. Per l'altro tipo di variabili, la tecnica più utilizzata è la regressione lineare.
Esempio di variabile categoriale
Per finire, diamo un'occhiata a un esempio molto comune nel marketing. Immaginiamo di voler vendere un prodotto e ci interessa conoscere lo stato civile.
Per fare ciò, assegneremo 1 a single, 2 a sposati, 3 a divorziati, 4 a partner e 5 ad altri.
Vediamo l'immagine e poi commentiamola:
In esso, possiamo vedere che la percentuale più alta di individui sono single, sposati e divorziati, mentre le altre due opzioni sono solo del 5%.
Come possiamo vedere, le variabili categoriali sono utili per il raggruppamento. Il grafico a barre ci permette di osservare meglio queste percentuali, poiché è più facile confrontare la dimensione delle barre.