Distribuzione normale - Che cos'è, definizione e concetto

Sommario:

Anonim

La distribuzione normale è un modello teorico in grado di approssimare in modo soddisfacente il valore di una variabile casuale a una situazione ideale.

In altre parole, la distribuzione normale adatta una variabile casuale a una funzione che dipende dalla media e dalla deviazione standard. Cioè, la funzione e la variabile casuale avranno la stessa rappresentazione ma con lievi differenze.

Una variabile casuale continua può assumere qualsiasi numero reale. Ad esempio, i rendimenti delle azioni, i risultati dei test, il QI e gli errori standard sono variabili casuali continue.

Una variabile casuale discreta assume valori naturali. Ad esempio, il numero di studenti in un'università.

La distribuzione normale è la base per altre distribuzioni come la distribuzione t di Student, la distribuzione chi-quadrato, la distribuzione F di Fisher e altre distribuzioni.

Formula della distribuzione normale

Data una variabile casuale X, diciamo che la frequenza delle sue osservazioni può essere approssimata in modo soddisfacente a una distribuzione normale tale che:

Dove i parametri della distribuzione sono il valore medio o centrale e la deviazione standard:

In altre parole, stiamo dicendo che la frequenza di una variabile casuale X può essere rappresentata da una distribuzione normale.

Rappresentazione

Funzione di densità di probabilità di una variabile casuale che segue una distribuzione normale.

Proprietà

  • È una distribuzione simmetrica. Il valore della media, della mediana e della moda coincidono. Matematicamente,

Media = Mediana = Modo

  • Distribuzione unimodale. I valori che sono più frequenti o che hanno maggiori probabilità di apparire sono intorno alla media. In altre parole, quando ci allontaniamo dalla media, la probabilità che i valori appaiano e la loro frequenza diminuisce.

Di cosa abbiamo bisogno per rappresentare una distribuzione normale?

  • Una variabile casuale
  • Calcola la media.
  • Calcola la deviazione standard.
  • Decidi la funzione che vogliamo rappresentare: funzione di densità di probabilità o funzione di distribuzione.

Esempio teorico

Supponiamo di voler sapere se i risultati di un test possono approssimare in modo soddisfacente una distribuzione normale.

Sappiamo che 476 studenti partecipano a questo test e che i risultati possono variare da 0 a 10. Calcoliamo la media e la deviazione standard dalle osservazioni (risultati del test).

Quindi, definiamo la variabile casuale X come i punteggi del test che dipendono da ogni singolo risultato. Matematicamente,

Il punteggio di ogni studente viene registrato in una tabella. In questo modo otterremo una visione globale dei risultati e della loro frequenza.

RisultatiFrequenza
020
131
244
356
464
566
662
751
839
926
1016
TOTALE476

Una volta fatta la tabella, rappresentiamo i risultati dell'esame e le frequenze. Se il grafico assomiglia all'immagine precedente e soddisfa le proprietà, la variabile dei risultati del test può essere approssimata in modo soddisfacente a una distribuzione normale di media 4,8 e deviazione standard di 3,09.

I risultati del test possono approssimare una distribuzione normale?

Motivi per considerare che la variabile dei risultati del test segue una distribuzione normale:

  • Distribuzione simmetrica. Cioè, ci sono lo stesso numero di osservazioni sia a destra che a sinistra del valore centrale. Inoltre, la media, la mediana e la moda hanno lo stesso valore.

Media = Mediana = Modo = 5

  • Le osservazioni con più frequenza o probabilità sono intorno al valore centrale. In altre parole, le osservazioni con minore frequenza o probabilità sono lontane dal valore centrale.

La distribuzione normale descrive la variabile casuale con un'approssimazione che produce errori standard (le barre sopra ogni colonna). Questi errori sono la differenza tra le osservazioni effettive (risultati) e la funzione di densità (distribuzione normale).