In questo post spieghiamo le proprietà della distribuzione t di Student.
In altre parole, la distribuzione t è una distribuzione di probabilità che stima il valore della media di un piccolo campione tratto da una popolazione che segue una distribuzione normale di cui non conosciamo la deviazione standard.
Articoli consigliati: gradi di libertà, gradi di libertà (esempio) e distribuzione normale.
Storia
William Sealy Gosset (1876-1937) nel 1908 ebbe la necessità di creare una distribuzione che lo aiutasse con calcoli statistici sulle birre a marchio Guinness in Irlanda. Poiché i risultati dovevano essere pubblicati utilizzando i dati privati del birrificio per dimostrare l'applicabilità della sua nuova distribuzione, l'azienda ha vietato ai suoi dipendenti di pubblicare informazioni riservate. Questa limitazione non ha impedito a Gosset di pubblicare la sua scoperta sotto lo pseudonimo di Alunno. Da quel momento in poi, la distribuzione t viene riconosciuta come distribuzione t di Student.
Proprietà della distribuzione t di Student
Le proprietà della distribuzione t di Student sono le seguenti:
- È una distribuzione simmetrica. Il valore della media, della mediana e della moda coincidono. Matematicamente,
- È una distribuzione unimodale. I valori che sono più frequenti o che hanno maggiori probabilità di apparire (modalità) sono intorno alla media. Quando ci allontaniamo dalla media, la probabilità che i valori appaiano e la loro frequenza diminuisce.
- Se abbiamo un campione di dimensione n, allora avremo una distribuzione t con (n-1) gradi di libertà.
In altre parole, la distribuzione avrà lo stesso numero di osservazioni su entrambi i lati del valore centrale.
- La funzione di densità non dipende dai gradi di libertà per essere simmetrica.
- La rappresentazione grafica assomiglia alla distribuzione normale, cioè è anche a forma di campana.
- Il valore medio o medio è zero (0).
- Più aumentano i gradi di libertà, più la distribuzione t sarà simile alla distribuzione normale.
Distribuzione normale vs distribuzione t
La distribuzione t e la distribuzione normale differiscono principalmente perché la distribuzione t assegna più probabilità alle osservazioni estreme rispetto alla distribuzione normale standard (varianza maggiore di 1). In altre parole, la distribuzione t ha code più larghe rispetto alla distribuzione normale.