Errore di tipo I - Che cos'è, definizione e concetto

L'errore di tipo 1 nelle statistiche è definito come il rifiuto dell'ipotesi nulla quando è effettivamente vera. Un errore di tipo 1 è anche noto come falso positivo o errore di tipo alfa.

Fare un errore di tipo 1 è fondamentalmente negare qualcosa quando è effettivamente vero. Si pensi, ad esempio, alla situazione di testare se una campagna di marketing effettuata sui social network aumenta le vendite di gelato per un'azienda in una settimana estiva. Le ipotesi sarebbero le seguenti:

H0: Le vendite non aumentano a causa della campagna estiva

H1: Aumento delle vendite dovuto alla campagna di marketing

Dopo aver valutato il traffico sul sito web dell'azienda e le pagine visitate dopo la campagna, viene rilevato quanto segue:

  • Aumento anche se di traffico e visite del 50%.
  • Aumento del 200% delle vendite di gelati.

Alla luce di questi risultati, si può concludere che la campagna pubblicitaria è stata fruttuosa e ha avuto un effetto a catena sull'aumento delle vendite. Tuttavia, pensiamo che in quella settimana ci sia stata un'ondata di caldo che ha portato le temperature sopra i 40 gradi.

Conoscendo quest'ultimo, dovremmo tenere conto del fattore di alta temperatura come causa dell'aumento delle vendite. Se non teniamo conto di questo, potremmo rifiutare la nostra ipotesi nulla quando è vera, cioè penseremmo che la nostra campagna sia stata un clamoroso successo quando in realtà la causa dell'aumento delle vendite è stato il forte caldo. Se arrivassimo a questa conclusione, rifiuteremmo l'ipotesi nulla quando è effettivamente vera e quindi commetteremmo un errore di tipo 1.

Cause di errore di tipo 1

L'errore di tipo 1 è legato alla significatività del contrasto o alfa, con l'errore della stima dei coefficienti e può verificarsi a causa di 2 violazioni tipiche delle ipotesi di partenza di una regressione. Questi sono:

  • Eteroschedasticità condizionale.
  • La correlazione seriale.

Una regressione che presentasse una qualsiasi delle precedenti violazioni sottostimerebbe l'errore dei coefficienti. Se ciò accade, la nostra stima della statistica t sarebbe maggiore della statistica t effettiva. Questi valori più grandi della statistica t aumenterebbero la probabilità che il valore cada nella zona di rifiuto.

Immaginiamo 2 situazioni.

Situazione 1 (stima dell'errore errata)

  • Significato: 5%
  • Misura di prova: 300 persone.
  • Valore critico: 1,96
  • B1: 1,5
  • Errore di stima del coefficiente: 0,5

T = 1,5 / 0,5 = 3

In questo modo il valore cadrebbe nella zona di rigetto e si rigetterebbe l'ipotesi nulla.

Situazione 2 (stima corretta dell'errore)

  • Significato: 5%
  • Misura di prova: 300 persone.
  • Valore critico: 1,96
  • B1: 1,5
  • Errore di stima del coefficiente: 1

T = 1,5 / 1 = 1,5

In questo modo il valore cadrebbe nella zona di non rigetto e non rifiuteremmo l'ipotesi.

Sulla base degli esempi precedenti, la situazione 1 in cui l'errore è sottostimato, porterebbe a rifiutare l'ipotesi nulla quando in realtà è vera, poiché come vediamo nella situazione 2 con l'errore stimato correttamente, non rifiuteremmo l'ipotesi essere vero.

Aiuterete lo sviluppo del sito, condividere la pagina con i tuoi amici

wave wave wave wave wave