E se i dati non fossero il nuovo petrolio?
Per anni si è raccontata questa metafora, ma è sbagliata
Ci sono luoghi comuni che sono difficili da rimuovere.
Uno di questi è l'idea per cui i dati rappresentano il nuovo petrolio. Ho provato più volte, anche nei miei libri, a sfatare questo concetto, ma senza successo.
Partecipo a tavole rotonde in cui si parla di dati come nuovo petrolio e con altri luoghi comuni davvero sbagliati.
Partiamo dal principio: il dato non ha significato da solo, ma diventa interessante che correlato ad altri dati che lo trasformano in informazioni.
Sono le informazioni che fanno la differenza, non i dati.
Avere tanti dati però significa poter estrarre informazioni più accurate, perché invece di applicare modelli statistici, si "contano" i dati e si hanno maggiori certezze.
Molto spesso conviene usare dei modelli statistici per ricostruire informazioni, andando a limitare il data set, la quantità di dati.
I dati raccolti sono spesso dati "sporchi", nel senso che contengono errori, imprecisioni e rumore, per cui è necessario uno sforzo, quindi un costo, per renderli utilizzabili. Questo è il motivo principale per cui i data scientist utilizzano la statistica.
Inoltre, la statistica è utile per le fasi di test per controllare se i modelli utilizzati sono validi, partendo da un piccolo campione di dati.
Il dato, quindi, non è il nuovo petrolio, è una molecola o un atomo del nuovo petrolio, perché il nuovo petrolio è l'informazione che potrebbe, e nella maggior parte dei casi è così, non comprende tutte le informazioni possibili.
Il passaggio dalla business intelligence agli analytics non è un passaggio banale, perché la business intelligence è centrata semplicemente sul passato, sulle informazioni immagazzinate, mentre la business analytics è proiettata sul presente e cerca di predire il futuro.
Il dato, quindi, c'era anche prima, solo che ora viene usato in maniera diversa, esistono strumenti sofisticati e l'intelligenza artificiale, nelle varie forme, è di grande supporto al business.
Senza dedurre informazioni dai dati, non si ha nient'altro che dei dati senza nessuno scopo.