Coefficiente di variazione - Che cos'è, definizione e significato

Il coefficiente di variazione, noto anche come coefficiente di variazione di Pearson, è una misura statistica che ci informa sulla dispersione relativa di un insieme di dati.

Cioè ci informa, come altre misure di dispersione, se una variabile si muove molto, poco, più o meno di un'altra.

Coefficiente di variazione Formula

Il suo calcolo si ottiene dividendo la deviazione standard per il valore assoluto della media dell'insieme e viene solitamente espresso in percentuale per una migliore comprensione.

  • X: variabile su cui calcolare la varianza
  • σX: Deviazione standard della variabile X.
  • | x̄ |: È la media della variabile X in valore assoluto con x̄ ≠ 0

Il coefficiente di variazione si vede espresso con le lettere CV o r, a seconda del manuale o del font utilizzato. La sua formula è la seguente:

Il coefficiente di variazione viene utilizzato per confrontare set di dati appartenenti a popolazioni diverse. Se osserviamo la sua formula, vediamo che tiene conto del valore della media. Pertanto, il coefficiente di variazione permette di avere una misura di dispersione che elimina le possibili distorsioni delle medie di due o più popolazioni.

Rango

Esempi di utilizzo del coefficiente di variazione invece della deviazione standard

Ecco alcuni esempi di questa misura di dispersione:

Confronto di set di dati di diverse dimensioni

Vogliamo comprare la dispersione tra l'altezza di 50 studenti in una classe e il loro peso. Per confrontare l'altezza, potremmo usare metri e centimetri come unità di misura e il chilogrammo per il peso. Confrontare queste due distribuzioni utilizzando la deviazione standard non avrebbe senso poiché stiamo cercando di misurare due diverse variabili qualitative (una misura di lunghezza e una di massa).

Confronta i set con una grande differenza tra le medie

Immaginiamo, ad esempio, di voler misurare il peso di scarafaggi e ippopotami. Il peso degli scarafaggi viene misurato in grammi o milligrammi e il peso degli ippopotami viene solitamente misurato in tonnellate. Se per la nostra misurazione convertiamo il peso dei coleotteri in tonnellate in modo che entrambe le popolazioni siano sulla stessa scala, utilizzare la deviazione standard come misura della dispersione non sarebbe appropriato. Il peso medio dello scarabeo misurato in tonnellate sarebbe così piccolo che se usassimo la deviazione standard, non ci sarebbe quasi alcuna dispersione nei dati. Questo sarebbe un errore poiché il peso tra le diverse specie di coleotteri può variare notevolmente.

Esempio di calcolo del coefficiente di variazione

Consideriamo una popolazione di elefanti e un'altra di topi. La popolazione di elefanti ha un peso medio di 5.000 chilogrammi e una deviazione standard di 400 chilogrammi. La popolazione di topi ha un peso medio di 15 grammi e una deviazione standard di 5 grammi. Se confrontiamo la dispersione di entrambe le popolazioni utilizzando la deviazione standard, potremmo pensare che vi sia una dispersione maggiore per la popolazione di elefanti rispetto a quella di topi.

Tuttavia, calcolando il coefficiente di variazione per entrambe le popolazioni, ci renderemmo conto che è esattamente l'opposto.

Elefanti: 400/5000 = 0,08
Topi: 5/15 = 0,33

Se moltiplichiamo entrambi i dati per 100, abbiamo che il coefficiente di variazione per gli elefanti è solo dell'8%, mentre quello dei topi è del 33%. Come conseguenza della differenza tra le popolazioni e il loro peso medio, vediamo che la popolazione con la maggiore dispersione non è quella con la maggiore deviazione standard.

Intervallo di confidenzaCoefficiente di correlazione lineare

Aiuterete lo sviluppo del sito, condividere la pagina con i tuoi amici

wave wave wave wave wave