Usa il mouse, frecce o sfoglia se touch
   Magazine del 13/05/2020
Digital Business

DAMA DmBok 2: tutta la conoscenza sul Data Management in un unico libro
Alla base della scienza dei dati ci sono sempre diversi fattori rilevanti: Data Quality,  Metadata, Data Governance e soprattutto sapere come porre le domande giuste

Molti anni fa qualcuno ha iniziato a pensare ai dati come a una risorsa all'interno dell'azienda. Oggi in molte aziende sono gli unici asset, aziende come Facebook, Airbnb, Linkedin per citarne solo alcune non esisterebbero senza i loro dati. DAMA-I ha sviluppato una metodologia essenziale per chiunque voglia fare della gestione delle informazioni il proprio lavoro. La certificazione CDMP è il primo passo per entrare nel mondo DAMA-I dove esiste un solo testo di riferimento valido: il DmBok 2.
DAMA - International Data Management Association - ha eletto il suo primo consiglio di amministrazione nel 1988. Il primo capitolo è stato fondato nel 1980 a Los Angeles. Da quel momento è diventato chiaro che la cosa più urgente in un settore che cominciava a muovere i primi passi era avere un quadro teorico unico. Un linguaggio che tutti i professionisti potevano capire e che oggi é un riferimento quando in qualsiasi progetto di gestione dei dati. Ma cos'è in realtà la gestione dei dati? Per citare DAMA, Data Management è lo sviluppo, l'esecuzione e il monitoraggio di piani, politiche, programmi e pratiche che forniscono, controllano, proteggono e aumentano il valore dei dati e delle informazioni durante il loro ciclo di vita.

Identikit del professionista della gestione dei dati

Un professionista della gestione dei dati è chiunque lavori in qualsiasi aspetto della gestione dei dati - dalla gestione tecnica dei dati durante tutto il loro ciclo di vita alla garanzia che i dati siano utilizzati e sfruttati in modo appropriato - per soddisfare gli obiettivi strategici dell'organizzazione. I professionisti della gestione dei dati svolgono numerosi ruoli, da quelli altamente tecnici (per esempio, amministratori di database, amministratori di rete, programmatori) a quelli strategici (per esempio,  data steward, data strategist, chief data officer). Quindi, chiunque debba gestire i dati deve approfondire le proprie conoscenze in modo che l'organizzazione possa sfruttarli nel modo più efficace possibile. Le attività di gestione dei dati sono di vasta portata. Essi comprendono tutto, dalla capacità di prendere decisioni coerenti su come ricavare un valore strategico dai dati, all'implementazione tecnica e alle prestazioni del database. Pertanto, la gestione dei dati richiede competenze sia tecniche che non tecniche (cioè di "business"). La responsabilità della gestione dei dati deve essere condivisa tra le funzioni aziendali (funzionali) e quelle IT (tecnologiche), e le persone di entrambe le aree devono essere in grado di collaborare per garantire che un'organizzazione disponga di dati di alta qualità che soddisfino le sue esigenze strategiche. I dati e le informazioni non sono solo beni nel senso che le organizzazioni investono per ottenere un valore futuro. I dati e le informazioni sono anche vitali per le operazioni quotidiane della maggior parte delle organizzazioni. Dalla fondazione di DAMA nel 1980 al 2020 molte cose sono cambiate, ci sono nuove tecnologie, ci sono anche aziende che hanno tra i loro beni quasi esclusivamente dati, ma la metodologia di DAMA è ancora la migliore base per un professionista che vuole concentrare le proprie conoscenze sul patrimonio informativo. DAMA definisce la gestione dei dati come un insieme di 11 aree di conoscenza e grazie al riferimento DMBoK 2 ha creato un quadro di eccellenza e di buone pratiche che è un riferimento a livello mondiale. Un volume di oltre 700 pagine che i professionisti del DM usano e citano quasi come la Bibbia. Il DMBoK 2 ha creato un quadro di eccellenza e di buone pratiche che é una refernza a livello mondiale. Questa metodologia identifica la gestione dei dati in 11 aree:

Data Governance: fornisce la direzione e la supervisione alla gestione dei dati, stabilendo un sistema di diritti di decisione sui dati che tiene conto delle esigenze dell'azienda.

Architettura dei dati: definisce il piano di gestione degli asset di dati allineandosi alla strategia organizzativa per stabilire i requisiti strategici dei dati e progettazioni per soddisfare tali requisiti

Modellazione e progettazione dei dati: Il processo di scoperta, analisi, rappresentazione e comunicazione dei requisiti dei dati in una forma accurata chiamata "modello"

Data Storage and Operations: Include la progettazione, l'implementazione e il supporto dei dati memorizzati per massimizzarne il valore Le operazioni forniscono supporto durante tutto il ciclo di vita dei dati, dalla pianificazione allo smaltimento.

Sicurezza dei dati: la sicurezza dei dati garantisce il mantenimento delle varie compliance e della riservatezza dei dati, la non violazione dei dati e il loro corretto accesso.

Integrazione e interoperabilità dei dati: comprende i processi relativi alla movimentazione e al consolidamento dei dati all'interno e tra i data warehouse, le applicazioni e le organizzazioni.

Gestione dei documenti e dei contenuti: comprende le attività di pianificazione, implementazione e controllo utilizzate per gestire il ciclo di vita dei dati e delle informazioni presenti in una varietà di supporti non strutturati, in particolare i documenti necessari per supportare i requisiti di conformità legale e normativa.

Reference e Master Data: Include la riconciliazione e la manutenzione continua dei dati critici condivisi per consentire l'uso coerente tra i sistemi della versione più accurata, tempestiva e pertinente della verità sulle entità aziendali critiche.

Data warehousing e business intelligence: comprende i processi di pianificazione, esecuzione e controllo per gestire i dati a supporto delle decisioni e consentire ai lavoratori della conoscenza di trarre valore dai dati attraverso l'analisi e la reportistica

Metadati: include le attività di pianificazione, esecuzione e controllo per consentire l'accesso a metadati integrati di alta qualità che includono definizioni, modelli, flussi di dati e altre informazioni critiche per la comprensione dei dati e del sistema attraverso il quale vengono creati, mantenuti e resi accessibili.


Qualità dei dati: include la pianificazione e l'implementazione di tecniche di gestione della qualità per misurare, valutare e migliorare l'adeguatezza dei dati per l'uso all'interno di un'organizzazione.

Il DMBok 2 e il Big Data

C'è un intero capitolo intitolato "Big Data & Data Science" che serve a guidare i professionisti del Data Management spiegando la differenza tra dati strutturati e non strutturati e introducendo i nuovi concetti di analisi dei modelli per la creazione di previsioni. Da alcuni anni siamo passati da un'analisi "specchietto retrovisore" che utilizza i dati storici ad una nuova frontiera dove, grazie al cloud computing, la capacità di calcolo e di memorizzazione non ha più un limite. Dal DMBok 2 si avverte che a causa della grande varietà di formati di dati è necessaria una disciplina ancora più rigida di quella dei tradizionali modelli di dati relazionali. Il DMBok 2 sottolinea soprattutto il concetto di Smart Data come vera fonte per il processo decisionale, questo si scontra un po' con la "cattiva abitudine" di riempire il Data Lake con informazioni non strutturate e non contestualizzate. Il DMBok2 si concentra sul concetto che alla base della scienza dei dati ci sono sempre diverse domande rilevanti: avere dati affidabili (Data Quality), sapere cosa significano questi dati (Metadata), sapere chi controlla e definisce questi metadati (Data Governance) e soprattutto sapere come porre le domande giuste.

@Michele Iurillo di Synergo!



Digital Business

numero di 13/05/2020
SOMMARIO di questa settimana

Condividi su LinkedIn




Sfoglia il prossimo articolo -->

*/ ?>