La statistica F è un test utilizzato per valutare il potere esplicativo di un gruppo di variabili indipendenti sulla variazione della variabile dipendente.
In questo modo, la statistica F cerca di determinare se, all'interno di un gruppo di variabili indipendenti, almeno una ha la capacità di spiegare una parte significativa della variazione della variabile dipendente.
Questo test è comunemente usato nell'inferenza statistica per verificare le ipotesi. Il risultato del suo calcolo viene confrontato con il valore critico di una distribuzione Snedecor F con il livello di confidenza assegnato per il test. È importante notare che questo test è una singola coda.
Viene utilizzato principalmente nelle regressioni multiple. Può essere utilizzato anche nella regressione semplice, sebbene porterebbe alla stessa conclusione dell'utilizzo di un'altra statistica chiamata statistica t.
RangoFormula della statistica F
La formula per la statistica F è la seguente:
SCR = Somma dei quadrati di regressione
SCE = Somma dei quadrati dei residui
N = Numero totale di osservazioni nel campione
K = Gradi di libertà
I gradi di libertà sono il numero di variabili esplicative che ha un modello. Cioè, il numero di variabili che vogliamo vedere se sono "affidabili".
r quadrato o coefficiente di determinazione