Data Science - Che cos'è, definizione e concetto

Sommario:

Anonim

La scienza dei dati è una disciplina che studia da dove proviene una certa base di informazioni. Discute anche come queste risorse possono essere interpretate e rappresentate per un uso produttivo.

Cioè, la data science è quella relativa alla gestione dei database, archiviati in file digitali, dai quali si possono estrarre molte informazioni utili come indicatori statistici. Questi possono aiutare, ad esempio, un'azienda a prendere decisioni aziendali.

Allo stesso modo, la data science fornisce strumenti che consentono non solo di interpretare, ma anche di rappresentare, ad esempio, in immagini, i dati disponibili. Quindi, abbiamo l'istogramma, il diagramma a barre, il grafico a torta, tra gli altri.

Come si può dedurre, questa scienza è interdisciplinare poiché copre principalmente le conoscenze di matematica, statistica e informatica.

Scienza dei dati e tipi di dati

Va inoltre notato che la scienza dei dati può funzionare con due tipi di dati:

  • Strutturato: Sono quelli che si organizzano, come quelle tabelle con colonne diverse, ognuna con una categoria diversa come: nome, cognome, età, numero documento di identità, ecc.
  • Non strutturato: Quelli che non corrispondono a un certo formato, come un testo scritto liberamente. In tal caso, è necessario interpretare il contenuto ed estrarre i dati che possono essere gestiti.

Tenendo conto di quanto spiegato, i professionisti specializzati in data science non devono avere solo capacità analitiche, ma devono essere in grado di comunicare il contenuto delle informazioni che hanno elaborato.

Importanza della scienza dei dati

La scienza dei dati è importante per le aziende o le istituzioni che devono lavorare con una grande quantità di dati. Quindi, questi possono diventare informazioni preziose.

Possiamo mettere in relazione la data science con i Big Data, che consiste nello sviluppo di meccanismi in grado di elaborare e gestire massicci dati che provengono da varie fonti. L'obiettivo è convertirli in informazioni che possano essere interpretate dall'essere umano e che lo aiutino a prendere decisioni.

Questi dati da elaborare possono provenire da transazioni tra individui e organizzazioni (come operazioni bancarie), azioni quotidiane delle persone (come ricerche su Internet), macchine (come il GPS del cellulare che registra dove è stato l'utente) o informazioni biometrico (come le impronte digitali).

Storia della scienza dei dati

Si può dire che lo statistico americano John Wilder Tukey abbia aperto la strada alla scienza dei dati negli anni '60, sottolineando l'importanza di analizzare i dati piuttosto che testare modelli statistici.

Tuttavia, è stato solo nel 1996 che il termine scienza dei dati è stato utilizzato per la prima volta nel titolo di una conferenza, nel discorso intitolato: "Scienza dei dati, classificazione e metodi correlati". Questo, nell'ambito della riunione dei membri della "Federazione internazionale delle società di classificazione" (IFCS) tenutasi a Kobe, in Giappone.

Un altro importante traguardo è arrivato nel 2005, quando il National Science Board ha pubblicato "Raccolta di dati digitali di lunga durata che abilita la ricerca e l'istruzione nel 21° secolo". In quel documento, i data scientist sono definiti come esperti di computer, programmatori di database e software e professionisti di altre discipline (come bibliotecari e archivisti), che sono cruciali per la corretta gestione di una raccolta di dati digitali.

Tuttavia, questo è ancora un campo di studio ancora in via di sviluppo.