La distribuzione t di Student o la distribuzione t è un modello teorico utilizzato per approssimare il momento del primo ordine di una popolazione distribuita normalmente quando la dimensione del campione è piccola e la deviazione standard è sconosciuta.
In altre parole, la distribuzione t è una distribuzione di probabilità che stima il valore della media di un piccolo campione tratto da una popolazione che segue una distribuzione normale e di cui non si conosce la deviazione standard.
Articoli consigliati: gradi di libertà, gradi di libertà (esempio) e distribuzione normale.
Formula di distribuzione t di Student
Data una variabile casuale continua L, diciamo che la frequenza delle sue osservazioni può essere approssimata in modo soddisfacente a una distribuzione t con g gradi di libertà tale che:
Rappresentazione della distribuzione t di Student
Funzione di densità di una distribuzione t con 3 gradi di libertà (df).
Come possiamo vedere, la rappresentazione della distribuzione t assomiglia molto alla distribuzione normale tranne per il fatto che la distribuzione normale ha code più larghe ed è più rinforzata. In altre parole, dovremmo aggiungere più gradi di libertà alla distribuzione t in modo che la distribuzione "cresca" e assomigli di più alla distribuzione normale.
Specialità
E… Perché la distribuzione t è così speciale?
Ebbene, perché a differenza della distribuzione normale che dipende dalla media e dalla varianza, la distribuzione t dipende solo dai gradi di libertà, dall'inglese, gradi di libertà (df). In altre parole, controllando i gradi di libertà, controlliamo la distribuzione.
Applicazione t dello studente
La distribuzione t viene utilizzata quando:
- Vogliamo stimare la media di una popolazione distribuita normalmente da un piccolo campione.
- La dimensione del campione è inferiore a 30 elementi, ovvero n <30.
Da 30 osservazioni, la distribuzione t assomiglia molto alla distribuzione normale, quindi useremo la distribuzione normale.
- La deviazione standard di una popolazione non è nota e deve essere stimata dalle osservazioni del campione.
Esempio
Assumiamo di avere 28 osservazioni di una variabile casuale G che segue una distribuzione t di Student con 27 gradi di libertà (df).
Matematicamente,
Poiché stiamo lavorando con dati reali, ci sarà sempre un errore di approssimazione tra i dati e la distribuzione. In altre parole, la media, la mediana e la moda non saranno sempre zero (0) o esattamente uguali.
Rappresentiamo la frequenza di ogni osservazione della variabile G mediante un istogramma.
La variabile casuale G può approssimare una distribuzione t?
Ragioni per considerare che la variabile G segue una distribuzione t:
- La distribuzione è simmetrica. Cioè, ci sono lo stesso numero di osservazioni sia a destra che a sinistra del valore centrale. Inoltre, la media e la mediana tendono ad essere vicine allo stesso valore. La media è approssimativamente zero, media = 0,016.
- Le osservazioni con più frequenza o probabilità sono intorno al valore centrale. Le osservazioni con minore frequenza o probabilità sono lontane dal valore centrale.