Distribuzione t di Student - Che cos'è, definizione e concetto

Sommario:

Distribuzione t di Student - Che cos'è, definizione e concetto
Distribuzione t di Student - Che cos'è, definizione e concetto
Anonim

La distribuzione t di Student o la distribuzione t è un modello teorico utilizzato per approssimare il momento del primo ordine di una popolazione distribuita normalmente quando la dimensione del campione è piccola e la deviazione standard è sconosciuta.

In altre parole, la distribuzione t è una distribuzione di probabilità che stima il valore della media di un piccolo campione tratto da una popolazione che segue una distribuzione normale e di cui non si conosce la deviazione standard.

Articoli consigliati: gradi di libertà, gradi di libertà (esempio) e distribuzione normale.

Formula di distribuzione t di Student

Data una variabile casuale continua L, diciamo che la frequenza delle sue osservazioni può essere approssimata in modo soddisfacente a una distribuzione t con g gradi di libertà tale che:

Rappresentazione della distribuzione t di Student

Funzione di densità di una distribuzione t con 3 gradi di libertà (df).

Come possiamo vedere, la rappresentazione della distribuzione t assomiglia molto alla distribuzione normale tranne per il fatto che la distribuzione normale ha code più larghe ed è più rinforzata. In altre parole, dovremmo aggiungere più gradi di libertà alla distribuzione t in modo che la distribuzione "cresca" e assomigli di più alla distribuzione normale.

Specialità

E… Perché la distribuzione t è così speciale?

Ebbene, perché a differenza della distribuzione normale che dipende dalla media e dalla varianza, la distribuzione t dipende solo dai gradi di libertà, dall'inglese, gradi di libertà (df). In altre parole, controllando i gradi di libertà, controlliamo la distribuzione.

Applicazione t dello studente

La distribuzione t viene utilizzata quando:

  • Vogliamo stimare la media di una popolazione distribuita normalmente da un piccolo campione.
  • La dimensione del campione è inferiore a 30 elementi, ovvero n <30.

Da 30 osservazioni, la distribuzione t assomiglia molto alla distribuzione normale, quindi useremo la distribuzione normale.

  • La deviazione standard di una popolazione non è nota e deve essere stimata dalle osservazioni del campione.

Esempio

Assumiamo di avere 28 osservazioni di una variabile casuale G che segue una distribuzione t di Student con 27 gradi di libertà (df).

Matematicamente,

Poiché stiamo lavorando con dati reali, ci sarà sempre un errore di approssimazione tra i dati e la distribuzione. In altre parole, la media, la mediana e la moda non saranno sempre zero (0) o esattamente uguali.

Rappresentiamo la frequenza di ogni osservazione della variabile G mediante un istogramma.

La variabile casuale G può approssimare una distribuzione t?

Ragioni per considerare che la variabile G segue una distribuzione t:

  • La distribuzione è simmetrica. Cioè, ci sono lo stesso numero di osservazioni sia a destra che a sinistra del valore centrale. Inoltre, la media e la mediana tendono ad essere vicine allo stesso valore. La media è approssimativamente zero, media = 0,016.
  • Le osservazioni con più frequenza o probabilità sono intorno al valore centrale. Le osservazioni con minore frequenza o probabilità sono lontane dal valore centrale.