I professionisti della gestione dei dati svolgono numerosi ruoli, da quelli altamente tecnici (per esempio, amministratori di database, amministratori di rete, programmatori) a quelli strategici (per esempio, data steward, data strategist, chief data officer).
Quindi, chiunque debba gestire i dati deve approfondire le proprie conoscenze in modo che l'organizzazione possa sfruttarli nel modo più efficace possibile.
Le attività di gestione dei dati sono di vasta portata.
Essi comprendono tutto, dalla capacità di prendere decisioni coerenti su come ricavare un valore strategico dai dati, all'implementazione tecnica e alle prestazioni del database.
DAMA definisce la gestione dei dati come un insieme di 11 aree di conoscenza e grazie al riferimento DMBoK 2 ha creato un quadro di eccellenza e di buone pratiche che è un riferimento a livello mondiale.
Un volume di oltre 700 pagine che i professionisti del DM usano e citano quasi come la Bibbia.
Il DMBoK 2 ha creato un quadro di eccellenza e di buone pratiche che é una refernza a livello mondiale.
Questa metodologia identifica la gestione dei dati in 11 aree:
Data Governance: fornisce la direzione e la supervisione alla gestione dei dati, stabilendo un sistema di diritti di decisione sui dati che tiene conto delle esigenze dell'azienda.
Architettura dei dati: definisce il piano di gestione degli asset di dati allineandosi alla strategia organizzativa per stabilire i requisiti strategici dei dati e progettazioni per soddisfare tali requisiti
Modellazione e progettazione dei dati: Il processo di scoperta, analisi, rappresentazione e comunicazione dei requisiti dei dati in una forma accurata chiamata "modello"
Data Storage and Operations: Include la progettazione, l'implementazione e il supporto dei dati memorizzati per massimizzarne il valore Le operazioni forniscono supporto durante tutto il ciclo di vita dei dati, dalla pianificazione allo smaltimento.
Sicurezza dei dati: la sicurezza dei dati garantisce il mantenimento delle varie compliance e della riservatezza dei dati, la non violazione dei dati e il loro corretto accesso.
Integrazione e interoperabilità dei dati: comprende i processi relativi alla movimentazione e al consolidamento dei dati all'interno e tra i data warehouse, le applicazioni e le organizzazioni.
Gestione dei documenti e dei contenuti: comprende le attività di pianificazione, implementazione e controllo utilizzate per gestire il ciclo di vita dei dati e delle informazioni presenti in una varietà di supporti non strutturati, in particolare i documenti necessari per supportare i requisiti di conformità legale e normativa.
Reference e Master Data: Include la riconciliazione e la manutenzione continua dei dati critici condivisi per consentire l'uso coerente tra i sistemi della versione più accurata, tempestiva e pertinente della verità sulle entità aziendali critiche.
Data warehousing e business intelligence: comprende i processi di pianificazione, esecuzione e controllo per gestire i dati a supporto delle decisioni e consentire ai lavoratori della conoscenza di trarre valore dai dati attraverso l'analisi e la reportistica
Metadati: include le attività di pianificazione, esecuzione e controllo per consentire l'accesso a metadati integrati di alta qualità che includono definizioni, modelli, flussi di dati e altre informazioni critiche per la comprensione dei dati e del sistema attraverso il quale vengono creati, mantenuti e resi accessibili.
Qualità dei dati: include la pianificazione e l'implementazione di tecniche di gestione della qualità per misurare, valutare e migliorare l'adeguatezza dei dati per l'uso all'interno di un'organizzazione.
Il DMBok 2 e il Big Data
C'è un intero capitolo intitolato "Big Data & Data Science" che serve a guidare i professionisti del Data Management spiegando la differenza tra dati strutturati e non strutturati e introducendo i nuovi concetti di analisi dei modelli per la creazione di previsioni.
Da alcuni anni siamo passati da un'analisi "specchietto retrovisore" che utilizza i dati storici ad una nuova frontiera dove, grazie al cloud computing, la capacità di calcolo e di memorizzazione non ha più un limite.
Dal DMBok 2 si avverte che a causa della grande varietà di formati di dati è necessaria una disciplina ancora più rigida di quella dei tradizionali modelli di dati relazionali.
Il DMBok 2 sottolinea soprattutto il concetto di Smart Data come vera fonte per il processo decisionale, questo si scontra un po' con la "cattiva abitudine" di riempire il Data Lake con informazioni non strutturate e non contestualizzate.
Il DMBok2 si concentra sul concetto che alla base della scienza dei dati ci sono sempre diverse domande rilevanti: avere dati affidabili (Data Quality), sapere cosa significano questi dati (Metadata), sapere chi controlla e definisce questi metadati (Data Governance) e soprattutto sapere come porre le domande giuste.
@Michele Iurillo di Synergo!
Se l'articolo ti è piaciuto, condividilo con gli amici e colleghi