I gradi di libertà sono la combinazione del numero di osservazioni in un set di dati che variano in modo casuale e indipendente meno le osservazioni che sono condizionate da questi valori arbitrari.
In altre parole, i gradi di libertà sono il numero di osservazioni puramente libere (che possono variare) quando stimiamo i parametri.
Differenziamo principalmente tra le statistiche che utilizzano la popolazione e i parametri del campione per conoscere i loro gradi di libertà. Discutiamo le differenze tra la media e la deviazione standard quando i parametri sono popolazione o campione:
Popolazione e parametri del campione
- Parametri della popolazione:
Poiché nelle popolazioni non conosciamo tutti i valori, i gradi di libertà saranno tutti gli elementi della popolazione: N.
Entrambe le statistiche consentono a tutte le osservazioni nel set di essere casuali e, quindi, ogni volta che stimiamo la statistica, otterremo risultati diversi. Quindi, le osservazioni che hanno il pieno diritto di variare sono tutte le osservazioni dell'insieme della popolazione. In altre parole, i gradi di libertà in questo caso sono tutti gli elementi della popolazione: N. Per questo motivo dividiamo entrambe le statistiche per la dimensione totale della popolazione (N).
- Parametri del campione (stime):
Nei campioni conosciamo tutti i valori.
Differenziamo la dimensione della popolazione (N) con la dimensione del campione (n).
Poiché conosciamo tutti i valori nei campioni, non abbiamo problemi a calcolare la media poiché consente a tutte le osservazioni nell'insieme di essere casuali.
Nel caso della deviazione standard, imponiamo una restrizione sui gradi di libertà: tutti gli elementi del campione (n) e sottraiamo 1 elemento.
Ma … Perché sottraiamo solo 1 e non 5 o 10 elementi dal campione (n)?
Più elementi sottraiamo, significa che più informazioni abbiamo sul parametro del campione, in questo caso la deviazione standard.
Più informazioni abbiamo, meno libertà (gradi di libertà) hanno le osservazioni del campione di assumere valori casuali. Più elementi sottraiamo dal campione, maggiore è la limitazione che imponiamo e meno gradi di libertà avrà il parametro del campione.
Esempio
Supponiamo di andare ad Andorra per vedere le finali della Coppa del Mondo di sci perché ci piace molto lo sci alpino. Portiamo una mappa che ci dice dove si trovano le diverse discipline e il nome di alcuni dei concorrenti, ma non viene specificato il numero di partenza di ogni partecipante. Ogni volta che dicono il nome del concorrente, grattiamo il suo nome. Poiché l'elenco dei concorrenti è limitato, arriverà il momento in cui conosceremo il nome del concorrente prima che lo annunci tramite gli altoparlanti.
Analizziamo la cronaca da un punto di vista matematico:
- Dimensione del campione (n) perché ci dicono solo il nome di alcuni dei partecipanti.
- Ogni partecipante può iniziare in modo casuale, l'ordine non ha importanza e non può competere di nuovo (combinazioni senza ripetizioni).
- L'ultimo partecipante sarà l'elemento noto (n-1). Quindi tutti gli altri partecipanti possono uscire casualmente tranne l'ultimo, che sappiamo per certo.
Leggi l'esempio dei gradi di libertà