La statistica non parametrica è una branca dell'inferenza statistica i cui calcoli e procedure si basano su distribuzioni sconosciute.
Le statistiche non parametriche non sono molto popolari. Tuttavia, esiste una letteratura molto ampia in merito. Il problema che la statistica non parametrica si propone di risolvere è la mancanza di conoscenza della distribuzione di probabilità.
In altre parole, le statistiche non parametriche cercano di scoprire la natura di una variabile casuale. Perché, una volta che sai come si comporta, esegui i calcoli e le metriche che lo caratterizzano.
Questo è l'obiettivo delle statistiche non parametriche. Lo vediamo più in dettaglio di seguito.
Obiettivo della statistica non parametrica
Esistono diversi tipi di distribuzioni di probabilità su cui lavorano le statistiche parametriche. Ora, quando non sappiamo a quale tipo di distribuzione di probabilità corrisponde una variabile, quali calcoli utilizziamo?
Cioè, quando non conosciamo la distribuzione di probabilità di un insieme di dati, dobbiamo fare inferenze statistiche con procedure non parametriche.
In altre parole, se non sappiamo che tipo di distribuzione di probabilità ha un fenomeno, non possiamo fare stime come se sapessimo davvero come è distribuito. Questo è l'obiettivo della statistica parametrica, permetterci di conoscere la distribuzione in modo da poter passare al passo successivo (statistica parametrica).
Test non parametrici
Naturalmente, se non sappiamo come si distribuisce un fenomeno casuale, cosa dovremmo fare? Molto facile. La nostra missione sarà quella di cercare di sapere come viene distribuito. Per cercare di scoprire che tipo di distribuzione ha un determinato fenomeno, abbiamo a disposizione una serie di test che ci aiutano a farlo. Tra i test non parametrici più popolari ci sono:
- test binomiale
- Test Anderson-Darling
- Il test di Cochran
- Test di Cohen kappa
- test di Fisher
- test di Friedman
- Il test di Kendall
- Test di Kolmogórov-Smirnov
- test di Kuiper
- Test di Mann-Whitney o test di Wilcoxon
- test McNemar
- test mediano
- Test di Siegel-Tukey
- Prova dei segni
- Coefficiente di correlazione di Spearman
- Tabelle incrociate
- Test di Wald-Wolfowitz
- Test del rango firmato Wilcoxon
Tutti questi test hanno lo scopo di dirci se una variabile casuale è distribuita in un modo o nell'altro. Ad esempio, un possibile risultato potrebbe essere: la variabile casuale X è distribuita al tasso di una distribuzione normale.
Detto questo, i risultati non sono infallibili. Per eseguire test non parametrici dobbiamo avere campioni statistici. Pertanto, i risultati possono essere affidabili ma non devono essere perfetti al 100%.