Intervallo di confidenza - Che cos'è, definizione e concetto

Sommario:

Intervallo di confidenza - Che cos'è, definizione e concetto
Intervallo di confidenza - Che cos'è, definizione e concetto
Anonim

Un intervallo di confidenza è una tecnica di stima utilizzata nell'inferenza statistica che consente di limitare una coppia o più coppie di valori, all'interno dei quali si troverà la stima puntuale desiderata (con una certa probabilità).

Un intervallo di confidenza ci consentirà di calcolare due valori attorno a una media campionaria (uno superiore e uno inferiore). Questi valori limiteranno un intervallo all'interno del quale, con una certa probabilità, si troverà il parametro della popolazione.

Intervallo di confidenza = media + - margine di errore

Conoscere la vera popolazione, in generale, è qualcosa di molto complicato. Consideriamo una popolazione di 4 milioni di persone. Possiamo conoscere la spesa media per consumi per famiglia di questa popolazione? In linea di principio sì. Dovremmo semplicemente sondare tutte le famiglie e calcolare la media. Tuttavia, seguire tale processo sarebbe estremamente laborioso e renderebbe lo studio piuttosto complicato.

In situazioni come questa, è più fattibile selezionare un campione statistico. Ad esempio, 500 persone. E su detto campione, calcola la media. Sebbene non sapremmo ancora il vero valore della popolazione, potremmo presumere che sarà vicino al valore del campione. A questo significa che aggiungiamo il margine di errore e abbiamo un valore dell'intervallo di confidenza. D'altra parte, sottraiamo quel margine di errore dalla media e avremo un altro valore. Tra questi due valori sarà la media della popolazione.

In conclusione, l'intervallo di confidenza non serve a dare una stima puntuale del parametro della popolazione, se ci può aiutare ad avere un'idea approssimativa di quale potrebbe essere quello vero. Ci consente di limitare tra due valori in cui verrà trovata la media della popolazione.

coefficiente di variazioneFrequenza cumulativa

Fattori da cui dipende un intervallo di confidenza

Il calcolo di un intervallo di confidenza dipende principalmente dai seguenti fattori:

  • Dimensione del campione selezionata: A seconda della quantità di dati che è stata utilizzata per calcolare il valore del campione, sarà più o meno vicino al vero parametro della popolazione.
  • Livello di confidenza: Ci informerà in quale percentuale di casi la nostra stima è corretta. I livelli normali sono 95% e 99%.
  • Margine di errore della nostra stima: Questo è chiamato alfa e ci informa della probabilità che il valore della popolazione sia al di fuori del nostro intervallo.
  • La stima nel campione (media, varianza, differenza di medie…): La statistica pivot per il calcolo dell'intervallo dipenderà da questo.

Esempio di intervallo di confidenza per la media, assumendo la normalità e la deviazione standard nota

La statistica pivot utilizzata per il calcolo sarebbe la seguente:

L'intervallo risultante sarebbe il seguente:

Vediamo come nell'intervallo a sinistra ea destra della disuguaglianza abbiamo rispettivamente il limite inferiore e superiore. Pertanto l'espressione ci dice che la probabilità che la media della popolazione si trovi tra questi valori è 1-alpha (livello di confidenza).

Esaminiamo meglio quanto sopra con un esercizio risolto come esempio.

Vuoi stimare il tempo medio impiegato da un corridore per completare una maratona. Per questo sono state cronometrate 10 maratone ed è stata ottenuta una media di 4 ore con una deviazione standard di 33 minuti (0,55 ore). Vuoi ottenere un intervallo di confidenza del 95%.

Per ottenere l'intervallo, dovremmo solo sostituire i dati nella formula dell'intervallo.

L'intervallo di confidenza sarebbe la parte della distribuzione ombreggiata in blu. I 2 valori delimitati da questo sarebbero quelli corrispondenti alle 2 linee rosse. La linea centrale che divide la distribuzione in 2 sarebbe il vero valore della popolazione.

È importante notare che in questo caso, dato che la funzione di densità della distribuzione N (0,1) ci dà la probabilità cumulativa (da sinistra al valore critico), dobbiamo trovare il valore che ci lascia 0,975 su la % di sinistra (questo è 1,96).