Statistica - Che cos'è, definizione e concetto
Una statistica è una qualsiasi funzione misurabile reale del campione di una variabile casuale.
Il concetto di statistico è un concetto di statistica avanzata. La definizione è breve e decisamente astratta. È un concetto molto ampio, ma, come vedremo più avanti, molto semplice.
Data la difficoltà del termine, effettueremo la descrizione per parti. Quindi, in primo luogo, sarà necessario descrivere cosa intendiamo per funzione misurabile reale. E, in seconda istanza, definiamo ciò che intendiamo come campione di una variabile casuale.
Una statistica è una funzione reale misurabile
Quando ci riferiamo a una funzione, stiamo parlando di una funzione matematica. Per esempio:
Y = 2X
In base ai valori che X assume, allora Y assumerà l'uno o l'altro valore. Supponiamo che X valga 2. Allora, Y varrà 4, risultato della moltiplicazione di 2 per 2. Se X vale 3, allora Y varrà 6. Risultato della moltiplicazione di 2 per 3.
Naturalmente, uno statistico non è solo una funzione. È una funzione reale e misurabile. Questo concetto matematico è francamente semplice. Reale, perché dà luogo a numeri reali e misurabile perché misurabile.
Le statistiche hanno innumerevoli applicazioni nella vita di tutti i giorni. Quindi ha senso che i valori che una statistica può produrre siano reali e misurabili.
Campione di una variabile casuale
Abbiamo sentito molte volte il concetto di campione. O il concetto di campione rappresentativo. In questo caso, non faremo distinzione tra i diversi tipi di campione. Utilizzeremo quindi il concetto di campione in senso lato.
Immaginiamo di voler conoscere la spesa media delle famiglie messicane per l'acquisto di vestiti. Ovviamente, non abbiamo risorse sufficienti per chiedere a tutta la popolazione messicana. Cosa facciamo? Lo stimiamo attraverso un campione. Un campione, ad esempio, di 50.000 famiglie.
Quel campione, si dice, dovrà rispondere a specifiche caratteristiche. Deve cioè essere rappresentativo e contenere molte famiglie di diverse aree geografiche, gusti, religioni o potere d'acquisto diversi. In caso contrario, non otterremo un valore affidabile.
Una variabile casuale
Ora è un campione, ma un campione di una variabile casuale. Cosa intendiamo per variabile casuale? Una variabile casuale, in parole semplici, è una variabile difficile da prevedere. Cioè, in condizioni simili, assume valori diversi.
Ad esempio, il numero che verrà lanciato quando lancerai un dado è una variabile casuale. Anche se lo lanciamo sempre in condizioni molto molto simili, otterremo risultati diversi.
Ora che abbiamo compreso la definizione tecnica del concetto, dobbiamo mettere insieme tutto ciò che abbiamo imparato. Sappiamo cos'è una funzione reale e misurabile. E sappiamo anche qual è il campione di una variabile casuale.
Come nonostante tutto, il concetto rimanga astratto, il modo migliore per capirlo sarà con un esempio.
Esempio statistico
Supponiamo che ci siano 100 studenti in una scuola. Un insegnante ci propone come attività, per cercare di stimare qual è il voto medio degli studenti di quella scuola in materia di matematica.
Poiché non abbiamo il tempo o le risorse per chiedere ai 100 studenti, abbiamo deciso di chiedere a 10 studenti. Da lì, proveremo a stimare il voto medio. Abbiamo i seguenti dati:
Alunno | Nota | Alunno | Nota |
1 | 4 | 6 | 9 |
2 | 8 | 7 | 7 |
3 | 6 | 8 | 2 |
4 | 7 | 9 | 5 |
5 | 9 | 10 | 3 |
Prima di calcolare il voto medio, seguendo lo scopo di questo articolo, applicheremo ciò che abbiamo appreso sulle statistiche su questo esempio.
Sappiamo che una statistica è una funzione reale e misurabile del campione di una variabile casuale. Abbiamo il campione di una variabile casuale (la tabella sopra). Con la quale, qualsiasi funzione reale e misurabile di detto campione sarà una statistica. Per esempio:
Statistica 1: Studente 1 + Studente 2 + Studente 3 +…. + Studente 10 = 60
Statistica 2: Studente 1 - Studente 2 + Studente 3 - Studente 4 +… - Studente 10 = 2
Statistica 3: -Studente 1 - Studente 2 - Studente 3 -… .- Studente 10 = -60
Queste tre statistiche sono funzioni reali e misurabili del campione. Con cui, sono statistici. A livello teorico, tutto questo ha senso. Il senso è che non tutte le statistiche saranno valide per stimare in base a quali parametri.
A questo punto entra in gioco il concetto di stimatore. Uno stimatore è una statistica a cui saranno richieste determinate condizioni in modo che possa calcolare in modo affidabile il parametro desiderato.
Ad esempio, per stimare il parametro che conosciamo come "voto medio" o "voto medio" abbiamo bisogno di uno stimatore. Conosciamo questo stimatore come "medio". La media è uno stimatore. Cioè, uno statistico che richiede determinate condizioni per poter calcolare il voto medio con determinate garanzie.
Se vogliamo conoscere il voto medio, dovremo sommare tutti i voti e dividere per il numero totale degli studenti. Vale a dire:
Voto medio = (4 + 8 + 6 + 7 + 9 + 9 + 7 + 2 + 5 + 3) / 10 = 6
La formula per la media è la stessa, qualunque sia il campione. Utilizzare sempre tutti i dati contenuti nel campione. In questo caso abbiamo i dati di 10 studenti e la formula media usa tutti e 10 i dati. Se avessimo 20 dati da 20 studenti, li useremmo tutti e 20. Le statistiche che soddisfano questa caratteristica sono note come statistiche sufficienti.
In conclusione, una statistica è una qualsiasi funzione reale e misurabile di un campione. Una volta che hai diverse statistiche possibili, sono necessarie determinate condizioni per poterle considerare come stimatori. E, grazie agli stimatori, possiamo provare a "prevedere" determinati valori da campioni più piccoli.