Data Mining - Che cos'è, definizione e concetto

Il data mining è il processo di ricerca in grandi database per trovare informazioni utili che possono essere utilizzate per prendere decisioni. Viene utilizzato anche il termine inglese "data mining".

Può essere inteso come la tecnologia e il software utilizzati per trovare modelli di comportamento all'interno del database. La base fondamentale per questo è che questi modelli aiutano il processo decisionale. Ad esempio, potrebbe aiutare le aziende a comprendere i modelli di comportamento dei propri clienti. In modo tale da facilitare la definizione di strategie per aumentare le vendite o ridurre i costi.

Vantaggi del data mining

Il vantaggio fondamentale di questo processo di analisi dei dati è il gran numero di scenari di business a cui può essere applicato, ad esempio abbiamo:

  • Predizione: Previsione delle vendite dell'azienda.
  • Probabilità: Selezione dei migliori clienti per un contatto diretto sia telefonico che via email.
  • Analisi della sequenza: Analisi dei prodotti che i clienti hanno acquistato e verifica delle interrelazioni tra di loro.

Fasi del data mining

All'interno di un processo di data mining possiamo trovare cinque fasi:

  • Obiettivo e raccolta dati: Il primo è concentrarsi sul tipo di informazioni che vogliamo ottenere. Immaginiamo l'esempio in cui un supermercato vuole sapere a che ora del giorno c'è la maggior presenza di clienti. Questo sarebbe l'obiettivo e le informazioni che il commercio vuole ottenere in questo caso.
  • Elaborazione e gestione dei dati: Una volta che conosciamo i dati che vogliamo raccogliere, li mettiamo al lavoro. Questa è forse la fase più difficile del processo. Ebbene, richiede la selezione del campione rappresentativo su cui verrà effettuata l'analisi. Una volta che il campione è stato scelto, deve essere analizzato quale tipo di variabili o modello di regressione verrà eseguito sul campione.
  • Selezione del modello: È strettamente correlato alla fase precedente. Si tratta di creare un modello o un algoritmo che ci dia il miglior risultato possibile. Per fare ciò è necessario effettuare un'analisi esaustiva delle variabili da includere nel modello. Questo diventa un compito complicato poiché dipenderà dal tipo di informazioni da analizzare. Pertanto, i data miner effettuano diversi test dell'algoritmo come: regressione lineare, albero decisionale, serie temporali, rete neurale, ecc.
  • Analisi e revisione dei risultati: Fondamentalmente si tratta di analizzare i risultati per vedere se danno una spiegazione logica. Spiegazione che facilita il processo decisionale sulla base delle informazioni fornite dai risultati.
  • Aggiornamento del modello: L'ultimo passaggio del processo sarebbe l'aggiornamento del modello. È molto importante che venga fatto nel tempo in modo che non diventi obsoleto. Le variabili del modello potrebbero diventare irrilevanti e pertanto è necessario un controllo periodico del modello.

Messaggi Popolari

Google, il più grande esponente dell'ingegneria fiscale

Il motore di ricerca, ora integrato nella società Alphabet, ha inviato quasi 11.000 milioni di euro al paradiso fiscale delle Bermuda dalla sua sede europea nei Paesi Bassi, al fine di evitare le tasse corrispondenti all'anno finanziario 2014. Le informazioni rilasciate dalla filiale di Amsterdam assicurano che la società online ha pagato solo 2,8 milioni di euroLeggi di più…

New York apre le porte all'innovazione straniera

La più grande metropoli degli Stati Uniti promuove nuove strategie rivolte agli imprenditori stranieri che hanno in mente un'idea imprenditoriale fattibile, pratica e che, insomma, possa aggiungere valore aggiunto all'economia. L'iniziativa, rivolta agli immigrati e che, quindi, è accompagnata da un programma che facilita il visto perLeggi tutto…

La concorrenza cinese mina il settore siderurgico

L'industria siderurgica non sta attraversando il suo momento più dolce. Negli ultimi otto anni, secondo l'associazione dei datori di lavoro Eurofer, si è perso il 20% dei suoi dipendenti, mentre il rallentamento del colosso asiatico ha portato alla sua penultima crisi, che include sia il surplus produttivo che una sanguinosa guerra dei prezzi. TheLeggi di più…

Il turismo a Madrid cresce anche se non spende abbastanza

I turisti che hanno visitato la Comunità nel 2015 sono stati oltre 5 milioni, il 13% in più rispetto all'anno precedente, secondo i dati pubblicati dall'Istituto nazionale di statistica (INE). Il risultato è un completo successo per una regione spesso associata al turismo interno, nonostante la bassa spesa da parte dei viaggiatori.Leggi di piùRead…