Il processo statistico è l'insieme delle fasi o fasi che devono essere completate per svolgere un'indagine basata su informazioni quantitative e ottenere risultati fedeli alla realtà studiata.
Quando si parla di processo statistico, si parla di una serie di passaggi che è consigliabile eseguire per ottenere risultati fedeli alla realtà che studiamo nello studio statistico che si intende realizzare. Ciò è necessario, poiché se non eseguiamo questi passaggi possiamo trarre conclusioni errate e, quindi, prendere decisioni sbagliate.
Ad esempio, immaginiamo di avere una gelateria. Abbiamo bisogno di sapere, approssimativamente, quanto gelato dovremmo comprare in base alla quantità di domanda che avremo. Quindi, se falliamo, potrebbero raggiungere i clienti ai quali dovremmo dire loro che non c'è gelato in questa gelateria. Al contrario, se ne abbiamo troppo, potrebbe essere rovinato. Pertanto, è necessario provare a stimare quanto dovremmo acquistare, o almeno un intervallo approssimativo. Se per calcolare tale intervallo raccogliamo dati non rappresentativi (ad esempio una gelateria situata in un'altra città meno agiata) potremmo sbagliarci.
Quindi, avendo questo chiaro, dobbiamo conoscere la serie di passaggi e dettagli che dobbiamo seguire in modo che i risultati si adattino alla realtà e prendiamo decisioni migliori.
Fasi del processo statistico
A seconda del manuale visitato o dell'autore, potremmo vedere diverse fasi con nomi diversi. In sostanza, quasi tutti i documenti sull'argomento comprendono le stesse sezioni, solo che alcune comprendono più fasi in una e altre frammentano maggiormente il processo.
Nel nostro caso, consideriamo che il processo statistico consiste in:
Dichiarazione problema
Nell'enunciazione del problema si colloca l'asse centrale su cui articolare tutto il resto. Questa fase risponde alla seguente domanda: cosa devo studiare e perché? A volte, per quanto incredibile possa sembrare porre il problema, può portarci alla conclusione che non abbiamo davvero bisogno di fare uno studio statistico.
Raccolta dati
Una volta sollevato il problema dobbiamo raccogliere i dati. Qui la metodologia è importante. Quindi ci sono considerazioni diverse. Quindi, dobbiamo stabilire il tipo di campionamento, la dimensione del campione, il tipo di raccolta dei dati (ad esempio attraverso banche dati o sondaggi personalizzati), di persona, online o telefonicamente, ecc.
Organizzazione dei dati
Una volta che abbiamo tutti i dati, resta da unificarli e organizzarli. Come in ogni cosa, abbiamo bisogno di inserire i dati in un programma o una piattaforma che ci permetta poi di calcolare determinate metriche e analizzarle correttamente. Per fare ciò, è sempre conveniente organizzare i dati. Inoltre, a volte avremo bisogno di raccogliere dati da diversi database che offrono formati di file diversi e sarà necessario unificare tutto nello stesso formato.
Analisi dei dati
Una volta sollevato il problema, i dati raccolti e organizzati, possiamo analizzarlo in modo efficace. A seconda della dichiarazione del problema, verrà effettuato un tipo di analisi o un altro. Ad esempio, se vogliamo sapere se due variabili sono dipendenti, potremmo usare un'analisi di cointegrazione. Se invece ciò che vogliamo studiare è la dispersione totale di un'attività finanziaria, ne calcoleremo l'intervallo statistico.
Interpretazione dei dati
Ultimo ma non meno importante, abbiamo l'interpretazione dei dati. È inutile svolgere correttamente tutte le fasi del processo statistico se alla fine l'interpretazione è sbagliata. Questo perché se l'interpretazione è sbagliata, le decisioni avranno un effetto indesiderato. Ad esempio, supponiamo di condurre uno studio sulla variabilità delle vendite di un'azienda. Se una volta ottenuti i risultati si scopre che c'è molta dispersione, va ridotta e si interpreta che non lo sia, questo potrebbe incidere negativamente sull'azienda.
I cinque passaggi si riflettono nel diagramma seguente:
Statistiche descrittive