Scienza dei dati: che cos’è ?

La domanda "Che cos'è esattamente la Data Science?" mi viene posta molto spesso. Anche i professionisti più esperti sembrano confusi al riguardo. 

Avete mai provato a cucinare? Per preparare un buon pasto sono necessari tre componenti: 

Gli ingredienti devono essere di qualità e la loro qualità conta. È possibile consumare gli ingredienti crudi, magari combinandoli in un'insalata. È anche possibile cucinarli. Il gusto del pasto dipenderà dagli strumenti di cottura utilizzati: una pentola piena d'acqua, una padella o un forno. È comunque necessaria una ricetta che guidi attraverso i passaggi del processo di cottura. L'analisi dei dati è simile alla cucina. 

I dati sono gli ingredienti. Sono numeri grezzi raccolti attraverso l'osservazione del mondo. I Big Data sono dati grezzi con un'enorme mole, varietà e velocità, che non possono essere elaborati su personal computer. Possiamo consumare i dati grezzi, ad esempio attraverso un cruscotto. Le analisi sono gli strumenti per elaborare i dati. Oggi, l'apprendimento automatico e l'intelligenza artificiale sembrano essere i migliori strumenti di elaborazione. Consentono ciò che è noto come analisi avanzata: sono come un forno di classe superiore! 

Infine, invece di un gustoso pasto, il risultato dell'analisi dei dati è un grande valore per le aziende. La Scienza dei Dati è la ricetta. Possiamo definire la Scienza dei Dati come l'insieme di processi che consentono l'estrazione di informazioni non banali dai dati grezzi attraverso l'analisi avanzata (vedi "Data Science", Kelleher e Tierney, MIT Press, aprile 2018)


CRISP-DM è un esempio di processo di Data Science. La storia di Walmart potrebbe essere esemplare per la Data Science. Quando nel 2004 Linda M. Dillman, Chief Information Officer di Walmart, voleva sapere quale fosse l'articolo più venduto durante gli uragani, la prima risposta che gli analisti diedero fu: "È l'acqua!". Linda sapeva già che l'acqua era molto richiesta durante le emergenze degli uragani. Chiese una risposta più precisa. Solo dopo alcune iterazioni gli analisti scoprirono che i Pop Tarts alla fragola erano l'articolo più venduto durante gli uragani e la birra il più venduto prima degli uragani. Puoi leggere l'articolo intero in inglese qui