Normalizzazione statistica - Che cos'è, definizione e concetto

Sommario:

Anonim

La normalizzazione statistica è la trasformazione in scala della distribuzione di una variabile al fine di poter effettuare confronti rispetto ad insiemi di elementi e alla media eliminando gli effetti delle influenze.

In altre parole, la normalizzazione è proporzioni senza unità di misura (adimensionale o invariante di scala) che ci permettono di confrontare elementi di diverse variabili e diverse unità di misura.

In statistica ed econometria, vengono utilizzate tabelle di distribuzione di probabilità standardizzate per trovare la probabilità che un'osservazione assume data la funzione di distribuzione che segue la variabile.

È importante non limitare il termine di normalizzazione solo a insiemi di elementi in cui la distribuzione normale è una buona approssimazione della loro frequenza.

Variabile statistica

tavolo

La tabella seguente riporta le standardizzazioni più comuni nelle statistiche applicate alla finanza e all'economia.

  • Il punteggio tipizzato o standard normalizza gli errori quando possiamo calcolare i parametri del campione.
  • La normalizzazione nella distribuzione t di Student normalizza i residui quando i parametri sono sconosciuti e facciamo una stima per ottenerli.
  • Il coefficiente di variazione utilizza la media come misura di scala, a differenza del punteggio standardizzato e del t di Student, che utilizzano la deviazione standard. La distribuzione è normalizzata per le distribuzioni di Poisson ed esponenziali.
  • Il momento standardizzato può essere applicato a qualsiasi distribuzione di probabilità che abbia una funzione generatrice di momento. In altre parole, che gli integrali dei momenti sono convergenti.

Applicazioni

Quante volte abbiamo letto che la normale distribuzione di probabilità sembra un'approssimazione sufficientemente buona della frequenza delle osservazioni e ci viene chiesto di trovare la probabilità che la variabile X assuma un determinato valore?

In altre parole, poniamo X ~ N (μ, σ2), e ci viene chiesto di trovare P (X ≤ xio)

Sappiamo che per trovare P (X ≤ xio), dobbiamo cercare la probabilità nelle tabelle di distribuzione di probabilità. In questo caso, nelle tabelle della distribuzione della distribuzione normale. Le tavole di distribuzione di probabilità più utilizzate in econometria e finanza quantitativa sono: chi-quadrato, t di Student, F di Fisher-Snedecor, Poisson, esponenziale, cauchy e normale standard.

Le probabilità calcolate nelle tabelle di distribuzione soddisfano la proprietà:

Cioè, le probabilità (i numeri all'interno della tabella) sono tipizzate. Quindi, dovremo anche digitare la nostra variabile secondo i parametri della funzione di distribuzione se vogliamo trovare la probabilità di P (X ≤ xio).

Esempio pratico

Vogliamo conoscere la probabilità che il numero di sciatori che vanno a sciare il venerdì mattina sia 288.

La stazione sciistica ci dice che la frequenza della variabile sciatori può approssimare una distribuzione normale di media 280 e varianza 16.

Quindi, abbiamo:

X ~ N (μ, σ2)

dove X è definita come la variabile "sciatori"

Ci chiedono la probabilità che il numero di sciatori che vanno a sciare il venerdì sia minore o uguale a 288. Ovvero:

P (X ≤ 288)

Processi

Per trovare la probabilità che il numero di sciatori sia pari a 288, dobbiamo prima digitare la variabile.

Quindi guardiamo la tabella di distribuzione della normale standard continua:

Z 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

La probabilità che 288 sciatori vadano a sciare un venerdì mattina è del 97,72% dati i parametri di media e varianza.