Segno statistico - Che cos'è, definizione e concetto

Sommario:

Anonim

Un campione statistico è un sottoinsieme di dati appartenenti a una popolazione di dati. Statisticamente deve essere costituito da un certo numero di osservazioni che rappresentino adeguatamente i dati complessivi.

La statistica, come branca della matematica, è responsabile della raccolta dei dati, dell'ordinamento e dell'analisi. In altre parole, quando vogliamo studiare un certo fenomeno ci rivolgiamo alla statistica. Un buon esempio di fenomeno studiato dalle statistiche è lo stipendio medio dei cittadini di un paese a

In questo senso, per motivi di tempo e di costo, non possiamo raccogliere tutti i dati. Questa totalità di dati è ciò che è noto come popolazione di dati o semplicemente popolazione.

Perché lavori con campioni statistici?

Per spiegare perché viene utilizzato un campione statistico al posto della popolazione totale, faremo ricorso all'esempio sopra sollevato.

Supponiamo di voler studiare un qualsiasi fenomeno. Nel nostro caso, questo fenomeno è lo stipendio medio dei cittadini di un paese. La popolazione dei dati è costituita da ogni singolo lavoratore nel paese. Naturalmente, per motivi di tempo e di costo, sarebbe impossibile chiedere a ciascun lavoratore qual è il suo stipendio annuo. Ci vorrebbe molto tempo o avremmo bisogno di molte risorse.

A questo punto compare il concetto di campione statistico. Invece di chiedere ai milioni di lavoratori in un paese o in una regione, raccogliamo solo una piccola quantità di dati. Ad esempio, abbiamo chiesto a 100.000 persone. Questo compito è ancora complicato, ma è molto più conveniente chiedere 100.000 persone che chiedere 30 milioni.

Questa piccola quantità di dati deve essere rappresentativa. Cioè, deve rappresentare adeguatamente la popolazione. Se le 100.000 persone che abbiamo chiesto sono concentrate nei quartieri ricchi, otterremo dati non rappresentativi. Lo stipendio medio sarebbe molto più alto di quello che è in realtà.

Caratteristiche di un campione statistico rappresentativo

Se vuoi fare una buona ricerca, la qualità del campione statistico è essenziale. È inutile eseguire le metriche statistiche più complesse con i modelli più sofisticati se il campione statistico è distorto. Cioè, se il campione non è rappresentativo.

Quando si ottiene un campione rappresentativo ci sono alcuni aspetti che il ricercatore deve conoscere in anticipo. Tra questi aspetti vi sono le caratteristiche di un campione rappresentativo. Le caratteristiche di un campione rappresentativo sono le seguenti:

  • Dimensioni abbastanza grandi: Quando lavoriamo con i campioni, normalmente lavoriamo con una quantità di dati inferiore alla popolazione. Tuttavia, affinché un campione statistico sia rappresentativo, deve essere sufficientemente ampio da essere considerato rappresentativo. Ad esempio, se la nostra popolazione è composta da 10 milioni di dati e ne scegliamo 10, è difficile che sia rappresentativa. Naturalmente, più ampio è il campione non sempre più rappresentativo.
  • Casualità: La selezione dei dati da un campione statistico deve essere casuale. Cioè, deve essere totalmente casuale. Se invece di farlo in modo casuale, eseguiamo un processo di selezione dei dati pianificato, stiamo introducendo una distorsione nella raccolta dei dati. Pertanto, per evitare che il campione sia distorto e, quindi, per renderlo un campione rappresentativo, dobbiamo effettuare una selezione casuale.

Inferenza statistica

Una volta ottenuto abbiamo il campione rappresentativo, allora è necessario dedurre determinate metriche. Spesso ci interessa conoscere una certa misura di una variabile. Nell'esempio iniziale, la variabile sarebbe lo stipendio dei cittadini di un paese. In questo senso, la metrica che vogliamo analizzare è lo stipendio medio dei cittadini di un Paese.

In altre parole, abbiamo una popolazione di dati composta da tutti i lavoratori in Messico. Da questa popolazione si ricava una variabile, cioè lo stipendio annuo. Utilizzando le tecniche appropriate otteniamo un campione rappresentativo. E infine, una volta che abbiamo un set di dati con cui possiamo lavorare, usiamo tecniche di inferenza statistica per calcolare lo stipendio medio.

Naturalmente, una volta che abbiamo il set di dati, potremmo dedurre altre misure. Ad esempio, come viene distribuito lo stipendio, quale percentuale di lavoratori è al di sotto di un determinato stipendio o quanto è grande il divario salariale.

Esempio statistico di esempio

Supponiamo di voler realizzare uno studio sulla spesa media delle famiglie colombiane nel mese di gennaio. Per questo abbiamo due opzioni:

  1. Inserisci i conti bancari di tutte le famiglie in Colombia
  2. Chiedi a un numero rappresentativo di persone

La prima opzione non è praticabile per diversi motivi. Primo, che le famiglie non rinunceranno ai propri dati e in secondo luogo che non potremmo nemmeno esaminare i dati famiglia per famiglia. Principalmente perché la popolazione della Colombia è vicina ai 50 milioni. Nel frattempo, il secondo è l'opzione per raccogliere un campione statistico.

Quello che faremo, seguendo le caratteristiche di cui sopra, sarà chiedere 100.000 famiglie. È un po' complicato ma molto più facile che chiedere a 50 milioni di colombiani. La differenza è notevole. Quindi, sulla base di quel campione di 100.000 famiglie, proveremo a calcolare la spesa media delle famiglie a gennaio.

I dati estratti saranno più o meno attendibili secondo una serie di metriche che vengono prese in considerazione nelle indagini statistiche. Naturalmente, questi tipi di metriche sono più avanzati e, pertanto, non li discuteremo qui.