Il p-value, dall'inglese, valore p, è il livello minimo di significatività non arbitraria con cui possiamo rifiutare l'ipotesi nulla (H0) data una funzione di distribuzione e una statistica test.
In altre parole, il p-value è la minima probabilità definita dalla distribuzione con cui possiamo rifiutare l'ipotesi nulla (H0) senza dover definire a priori il livello di significatività del contrasto.
Se ricordi, ricorderai che l'area sotto la curva della funzione di distribuzione è una probabilità. Quindi, da questo punto di vista, il p-value sarà la probabilità di osservare una statistica test così estrema affinché l'ipotesi nulla sia vera.
Dominio
Poiché il p-value è una probabilità, questo valore sarà compreso tra 0 e 1.
Non arbitrario
A differenza dei livelli di significatività che siamo più abituati a vedere, come 1%, 5% e 10%, il valore p dipende dalla funzione di distribuzione che ha la statistica del test. Quindi i livelli dell'1%, 5% e 10% vengono decisi all'inizio del contrasto. Questa selezione è chiamata arbitraria.
Formula del valore P
Il p-value non è un singolo valore come il valore critico, ma dipenderà dalla statistica. Per diversi valori della statistica del test, il valore critico sarà lo stesso. D'altra parte, per diversi valori della statistica del test, anche il p-value sarà diverso, perché il p-value dipende dal valore che assume la statistica del test.
Dove,
- D, è una variabile casuale che segue una certa distribuzione.
- d, è il valore della statistica del test.
Calcolo
È possibile calcolare il p-value a mano ma si dovrebbero avere tabelle di distribuzione molto precise, cioè con molti decimali perché il p-value tende ad essere piccolo. La maggior parte dei programmi statistici ha già incorporato il p-value e normalmente appare nell'output dei risultati della stima di Ordinary Least Squares (OLS). Può sembrare difficile da usare ma con la pratica è uno strumento molto utile.
Per calcolare il p-value abbiamo bisogno di:
- Statistica del contrasto.
- La distribuzione della statistica del contrasto e la conoscenza dei suoi parametri.
Regola di rifiuto
Se p-value < livello di significatività => rifiuto H0.
Se p-value > livello di significatività => Nessun rifiuto H0.
Rappresentazione
Nel caso di una distribuzione t di Student con 2 gradi di libertà e una statistica di contrasto pari a 3, la probabilità di trovare una statistica così estrema quando l'ipotesi nulla (H0) è vera è del 4,77%.
In altre parole, se l'ipotesi nulla (H0) fosse vera, una statistica grande come 3 verrebbe osservata solo il 4,77% delle volte.
Perché si chiama p-value?
Il nome del p-value ha origine nella definizione che si riferisce all'essere l'area sotto la curva della funzione di distribuzione al di fuori dell'intervallo di confidenza. Quindi, poiché quell'area è la minima probabilità di rifiutare l'ipotesi nulla, il "p" di p-value si riferisce al probabilità. E, poiché il p-value corrisponde a un numero, e quindi a un valore, alla cifra numerica viene attribuita la parola "value" di p-value. In alcuni libri possiamo trovare "valore di probabilità" riferito al p-value. Forse dire "probabilità minima di rifiutare l'ipotesi nulla" era troppo lungo e non aveva alcun mistero per gli studenti…