Box Plot - Che cos'è, definizione e concetto

Sommario:

Box Plot - Che cos'è, definizione e concetto
Box Plot - Che cos'è, definizione e concetto
Anonim

Un boxplot, dall'inglese, boxplot, è una rappresentazione di una variabile quantitativa o categoriale allo scopo di identificare rapidamente i quartili del set di dati.

In altre parole, un boxplot è un grafico che rappresenta una variabile quantitativa o qualitativa attraverso i quartili.

In statistica, è uno strumento utile per rappresentare insiemi di dati sia discreti che continui.

È importante tenere presente che le variabili variabili qualitative o che intendono rappresentare un ordine o una categoria devono sempre essere legate ad un indice numerico maggiore di 0 affinché possano comparire sul grafico e si possano calcolare le relative statistiche.

Box plot e istogramma

Un box plot non è altro che un istogramma visto dall'alto, e allo stesso modo un istogramma è un box plot visto di lato. Un esempio può essere visto di seguito.

La prima caratteristica condivisa da entrambi i grafici è il minimo e il massimo del set di dati. Le barre finali dopo i trattini indicano il minimo (barra inferiore) e il massimo (barra superiore). I valori anomali sarebbero rappresentati al di fuori dell'intervallo del massimo e del minimo. Cioè, oltre le barre dopo i trattini. Possiamo anche trovare box plot orizzontali.

A colpo d'occhio puoi vedere che la maggior parte dei dati è centrata sulle osservazioni vicine al minimo in entrambi i grafici. Questo è indicato dal box plot in cui il box è più vicino al minimo che al massimo. Se osserviamo l'istogramma, vedremo che le osservazioni più frequenti sono quelle vicine al minimo e lontane dal massimo.

Informazioni sul box plot

Le informazioni fornite dal box plot sono le seguenti:

  1. La parte inferiore del riquadro è il primo quartile (Q1).
  2. La barra al centro del riquadro è la mediana o il secondo quartile (Q2).
  3. La parte superiore della scatola è il terzo quartile (Q3).
  4. L'intervallo interquartile o IQR sarebbe l'altezza della scatola, ovvero la differenza tra Q3 e Q1.

Tasto box plot

Questa rappresentazione grafica è chiamata box plot perché ha l'aspetto di una scatola. Pertanto, per ricordare questo grafico, dovremmo solo pensare a un oggetto quadrato oa una scatola.

Per i lettori che hanno familiarità con il prezzo delle attività finanziarie, vedranno più somiglianza con una candela. Le candele che vedi nel preventivo sono grafici a scatola adattati alla finestra temporale scelta.

Vantaggi e svantaggi del box plot

Tra i vantaggi e gli svantaggi di questo diagramma troviamo quanto segue:

Vantaggio

  • Visione globalizzata della frequenza assoluta di una variabile quantitativa o qualitativa.
  • Conoscenza dei minimi, massimi e quartili del set di dati senza doverli calcolare.
  • Riconoscimento dei valori estremi più veloce rispetto a un istogramma perché i valori estremi sono indicati con cerchi fuori dal massimo e dal minimo.

Svantaggi

  • Se il set di dati è piccolo, creare un box plot per esprimere quei dati renderà più difficile la comprensione.

Esempio di box plot

Supponiamo di voler rappresentare il numero di ciclisti che passano per casa nostra nell'arco di un anno. Per prima cosa contiamo i ciclisti e raccogliamo le informazioni in una tabella.

Attraverso alcuni programmi come R o Excel possiamo generare il grafico mostrato di seguito.

Grazie alla rappresentazione del numero di ciclisti attraverso il box plot, possiamo intuire velocemente dove si trova la mediana, gli altri quartili, il massimo e il minimo. In questo caso non abbiamo dati atipici poiché oltre il massimo e il minimo non c'è nulla.

L'applicazione di questo tipo di grafico è molto comune data la sua semplicità e utilità in molte aree al di là della finanza e dell'economia.