Livelli di significatività - Che cos'è, definizione e concetto

I livelli di significatività sono il complemento dell'intervallo di confidenza di una distribuzione e vengono utilizzati per testare l'ipotesi nulla (H0) in un test di inferenza statistica.

In altre parole, i livelli di significatività sono le probabilità che lasciamo al di fuori dell'intervallo di confidenza di una distribuzione e ci aiutano a determinare se la statistica del test è nella zona di rifiuto o meno.

Relazione tra livello di significatività e livello di confidenza

Sicuramente tutti abbiamo sentito chiedersi quale valore dovremmo assegnare all'alfa della distribuzione o con quale livello di confidenza calcoliamo l'intervallo, matematicamente, (1-alfa). La risposta di solito è sempre 1%, 5% o 10% per l'alfa o 99%, 95% e 90% per il livello di confidenza.

È importante essere chiari su quanto segue:

  • 1%, 5%, 10% = alfa => Livelli di significatività.
  • 99%, 95%, 90% = (1-alfa) => Intervallo di confidenza.

Gli intervalli di confidenza e i livelli di significatività sono complementari poiché la somma di entrambi è l'area della funzione di densità. Poi,

Sappiamo già che l'area della funzione di densità è 1. Matematicamente, siamo in grado di risolvere questo integrale:

Rappresentazione del livello di significatività

In questo caso è stata utilizzata la distribuzione t di Student con 16 gradi di libertà per mostrare quali aree della funzione appartengono ai livelli di significatività. Le percentuali (2,5%, 2,5% e 95%) corrispondono all'area sotto la funzione di densità. Poiché questa distribuzione ha due code, il livello di significatività è diviso a metà, quindi 2,5% + 2,5% = 5%. Il valore critico di questa distribuzione con 16 gradi di libertà e 5% come livello di significatività è 2,11991 in ciascuna coda.

2,5% + 2,5% + 95% = 1%

universale

Etichettiamo i livelli di significatività come universali perché questi livelli sono noti e utilizzati in tutti i test statistici. È molto insolito trovare un livello di significatività del 20% o 35% a meno che non si tratti di una condizione di test esplicita.

È vero che i livelli 1% e 5% sono più popolari del livello 10%, ma è per motivi di precisione. È meglio dare un risultato 1 volta su 100 (1/100 = 0,01 = 1%) o 5 volte su 100 (5/100 = 0,05 = 5%) che 10 volte su 100 (10/100 = 0,1 = 10%), giusto?

Inoltre, i livelli di significatività sono chiamati percentili, ad esempio 1% percentile o 5% percentile. Questa nomenclatura è ampiamente utilizzata per calcolare la metrica del valore a rischio (VaR).

Arbitrario e non arbitrario

I livelli di significatività possono essere arbitrari e non arbitrari. Quelli arbitrari sono i valori che scegliamo a priori (prima) conoscere le caratteristiche dell'esperimento. In questo caso, sarebbe prima di calcolare la statistica del test. Quelli non arbitrari sono quelli che si ottengono da un risultato dell'esperimento. In questo caso, il p-value, perché dipende dal valore assunto dalla statistica del test. Entrambi dipendono dalla distribuzione che seguono i dati.