Data Mining - Che cos'è, definizione e concetto

Sommario:

Data Mining - Che cos'è, definizione e concetto
Data Mining - Che cos'è, definizione e concetto
Anonim

Il data mining è il processo di ricerca in grandi database per trovare informazioni utili che possono essere utilizzate per prendere decisioni. Viene utilizzato anche il termine inglese "data mining".

Può essere inteso come la tecnologia e il software utilizzati per trovare modelli di comportamento all'interno del database. La base fondamentale per questo è che questi modelli aiutano il processo decisionale. Ad esempio, potrebbe aiutare le aziende a comprendere i modelli di comportamento dei propri clienti. In modo tale da facilitare la definizione di strategie per aumentare le vendite o ridurre i costi.

Vantaggi del data mining

Il vantaggio fondamentale di questo processo di analisi dei dati è il gran numero di scenari di business a cui può essere applicato, ad esempio abbiamo:

  • Predizione: Previsione delle vendite dell'azienda.
  • Probabilità: Selezione dei migliori clienti per un contatto diretto sia telefonico che via email.
  • Analisi della sequenza: Analisi dei prodotti che i clienti hanno acquistato e verifica delle interrelazioni tra di loro.

Fasi del data mining

All'interno di un processo di data mining possiamo trovare cinque fasi:

  • Obiettivo e raccolta dati: Il primo è concentrarsi sul tipo di informazioni che vogliamo ottenere. Immaginiamo l'esempio in cui un supermercato vuole sapere a che ora del giorno c'è la maggior presenza di clienti. Questo sarebbe l'obiettivo e le informazioni che il commercio vuole ottenere in questo caso.
  • Elaborazione e gestione dei dati: Una volta che conosciamo i dati che vogliamo raccogliere, li mettiamo al lavoro. Questa è forse la fase più difficile del processo. Ebbene, richiede la selezione del campione rappresentativo su cui verrà effettuata l'analisi. Una volta che il campione è stato scelto, deve essere analizzato quale tipo di variabili o modello di regressione verrà eseguito sul campione.
  • Selezione del modello: È strettamente correlato alla fase precedente. Si tratta di creare un modello o un algoritmo che ci dia il miglior risultato possibile. Per fare ciò è necessario effettuare un'analisi esaustiva delle variabili da includere nel modello. Questo diventa un compito complicato poiché dipenderà dal tipo di informazioni da analizzare. Pertanto, i data miner effettuano diversi test dell'algoritmo come: regressione lineare, albero decisionale, serie temporali, rete neurale, ecc.
  • Analisi e revisione dei risultati: Fondamentalmente si tratta di analizzare i risultati per vedere se danno una spiegazione logica. Spiegazione che facilita il processo decisionale sulla base delle informazioni fornite dai risultati.
  • Aggiornamento del modello: L'ultimo passaggio del processo sarebbe l'aggiornamento del modello. È molto importante che venga fatto nel tempo in modo che non diventi obsoleto. Le variabili del modello potrebbero diventare irrilevanti e pertanto è necessario un controllo periodico del modello.