Bias di sopravvivenza - Che cos'è, definizione e concetto

Sommario:

Anonim

Il pregiudizio di sopravvivenza è un pregiudizio che si verifica nella raccolta dei dati quando i dati vengono esclusi dall'analisi perché oggi non esistono più.

Questo pregiudizio sorge in un'ampia varietà di contesti in cui ci concentriamo solo su quei dati "sopravvissuti". Un esempio di ciò si vede quando le aziende intervistano i propri clienti su uno dei loro prodotti. Ma lasciano i loro non clienti, che in questo caso sarebbero i “non sopravvissuti”, nell'oblio.

In questo caso, trarre conclusioni da quello studio sarebbe sbagliato. Dal momento che i risultati sarebbero distorti solo dalla popolazione "sopravvissuta". E non sarebbero risultati rappresentativi.

Bias di sopravvivenza nella pratica

Un chiaro esempio di questo bias può essere visto nello studio dei risultati dei fondi di investimento. Dove la maggior parte dei database include solo i fondi che esistono oggi. Indipendentemente dai fondi che esistevano in passato.

Il motivo per cui oggi non esistono è perché la loro performance è stata peggiore dei "sopravvissuti". O anche più fondi sono stati fusi in uno solo. Pertanto, l'analisi viene condotta su quei fondi con i migliori risultati. E questo bias tende a sovrastimare la performance del campione di questi fondi.

Il problema principale non è più solo la sopravvalutazione della performance del fondo. Piuttosto, il campione selezionato non sarebbe un campione casuale della popolazione totale. E, quindi, i risultati dello studio potrebbero non essere rappresentativi della popolazione. Che alla fine questo è ciò che cerchiamo quando selezioniamo un campione casuale della popolazione.

Soluzione al pregiudizio di sopravvivenza

Immaginiamo di voler selezionare un fondo di investimento su cui investire, in base al suo comportamento passato. Per evitare questo bias di sopravvivenza e ottimizzare tale selezione, dovremmo eseguire i seguenti passaggi:

  • Scegli l'orizzonte temporale con cui intendiamo lavorare. Ad esempio, dieci, quindici o vent'anni di storia.
  • Prendi tutti i fondi esistenti dall'inizio dell'orizzonte temporale, indipendentemente dal fatto che esistano o meno al momento.
  • Da lì, seleziona il campione da quella popolazione per lo studio del comportamento.

L'idea di questo, alla fine, è ottenere quel campione casuale della popolazione. E da lì, le conclusioni ottenute, se potevano essere rappresentative di quella popolazione.