Usa il mouse, frecce o sfoglia se touch
   numero di 10/04/2019
Digital Business

Data Governance: strategica per prendere decisioni migliori
Iurillo (Synergo!): gestire i dati e i metadati è fondamentale per il data management

Oggi si parla molto di Data Governance, quasi sempre l'attenzione si concentra su due aspetti fondamentali: il rispetto della legislazione attuale e futura e la sicurezza. Ma è davvero solo questo? La verità è che c'è un po' di più.
Se seguiamo l'approccio di DAMA (Data Management Association) alla gestione dei dati, la governance è l'elemento centrale. Non c'è gestione dei dati senza di essa. Non possiamo farne a meno. Ecco perché forse dovremmo conoscerla un po' meglio.
Secondo uno studio di Microsoft e EY, la Data Governance è fondamentale per lo sviluppo dell'Intelligenza Artificiale: "La governance dei dati non è un compito insignificante. Uno dei maggiori ostacoli per le società di dati è la governance, in particolare, chi possiede i dati, come si accede ai dati, come accedervi e chi può accedervi sono tutte questioni essenziali quando si lavora con l'Intelligenza Artificiale." (da Artificial Intelligence in Europe How 277 Major Companies Benefit from AI Outlook for 2019 and Beyond). Ma quali sono gli aspetti che la Data Governance copre?
Esistono diverse soluzioni sul mercato, alcune si concentrano su determinati aspetti della Governance altri presentano un ecosistema completo e a volte costoso dove tutti gli aspetti di seguito elencati sono presenti nella soluzione. Altre volte per ragioni diverse molti CDO (Chief Data Officer) si affidano a diversi moduli diversi dipendendo dalle esigenze tecnologiche della struttura tecnologica che si trovano di fronte. Possiamo affermare che una suite di Data Governance dovrebbe avere questi componenti:
Metadata repositories - Usato per documentare e gestire i metadati e per eseguire analisi utilizzando i metadati. Le organizzazioni possono anche utilizzare i repository per pubblicare informazioni sulle risorse riutilizzabili, consentendo agli utenti di sfogliare i metadati durante le attività del ciclo di vita come la progettazione, il testing e la gestione dei rilasci.
Business Glossary - Un repository utilizzato per comunicare e governare i termini aziendali, le definizioni associate e le relazioni tra questi termini.
Data lineage - Specifica l'origine dei dati e dove si muove nel tempo. Descrive anche cosa succede ai dati durante i diversi processi. Il lignaggio dei dati può aiutare ad analizzare come le informazioni vengono utilizzate e a tracciare i bit chiave di informazioni che servono ad uno scopo particolare. Sono diverse le normative che ci impongono la gestione del lignaggio dei dati soprattutto in banking.
Analisi dell'impatto - Fornisce dettagli completi sulle dipendenze delle informazioni o sull'impatto di un cambiamento all'interno di una fonte di dati. Normalmente i software moderni possono rappresentarla in forma grafica per poter studiare tutte le relazioni tra i dati nelle tabelle relative.
Gestione delle regole - Automatizza l'applicazione delle regole aziendali legate agli elementi di dati e ai metadati associati. Questa capacità supporta interfacce dedicate per la creazione e l'ordine di esecuzione e i collegamenti con la gestione delle informazioni per una governance efficace.
Strutture semantiche - Include il supporto per tassonomie, modelli di relazioni tra entità (ER) e linguaggi di ontologia e modellazione come il Resource Description Framework (RDF), il Web Ontology Language (OWL) e l'Unified Modeling Language (UML).
Ingestione e traduzione di metadati - Utilizzo di tecniche o collegamenti per varie fonti di dati.
Data Quality: Anche se esistono diverse suite specializzate nel processo di Data Quality alcune soluzioni non includono questa importante parte del processo di Governance. Normalmente si differenzia tra:
- Normalizzazione: per far si che i termini e i valori siano univoci (questa procedura é di solito presente in origine negli ERP.
- Data Cleansing: la pulizia dei dati e una eventuale nuova uniformaticitá degli stessi.
- Data Augmenting: l'arricchimento dei dati con altri dati (esempio avere le coordinate geografiche o catastali a partire da un indirizzo)
- Data Decuplication: per vigilare l'unicitá dei dati stessi. Evitare che ri ripetano nominativi o eventi duplicati.
Bisogna pensare la Data Quality come un processo continuo e non come qualcosa che si realizza all'inizio del processo una sola volta. La Data Virtualization puó alimentare sistemi che hanno bisogno di essere governati anche senza passaggi ETL previ. Il controllo di qualitá del dato é essenziale.
Dobbiamo pensare che normalmente la Data Governance si occupa dei Metadati. Che ci siano 4 milioni di petabyte di dati o pochi mb lo sforzo é lo stesso. Capire i dati attraverso i metadati o arricchire questi metadati con tutta la informazione che manca. Normalmente una suite di Data Governance deve avere questa caratteristica: arricchire i metadati.

Qualche concetto da enfatizzare

Se è vero che il 75% del patrimonio delle società analizzate da Standard&Poors non è fisico: di cosa stiamo parlando? Dati!
Quale valore avrebbero aziende come Booking, AirBNB, Facebook senza i loro dati (e i nostri)? Questo è un motivo piú che sufficiente per capire l'importanza di governare i dati. Non siamo nella "trasformazione digitale", non si tratta di qualcosa che arriva e a cui dobbiamo adattarci, si tratta di parlare di "abitudine all'evoluzione digitale". Perché è un processo continuo, non qualcosa di puntuale. Un processo che necessita di Data Governance così come di altri aspetti relativi ai dati (qualità dei dati, analisi dei dati, virtualizzazione dei dati, ecc.)
Siamo nell'era dei metadati.
Se è vero che la Business Intelligence ha cristallizzato la strategia (passando da "cosa" fare a "come" farlo), la virtualizzazione dei dati ha permesso di liberare i dati da collegamenti fisici; la Data Governance concentrerà i suoi sforzi sui metadati. Non importa più quanti dati possiamo trattare o come li trattiamo. Dobbiamo sapere cosa dicono questi dati e chi decide di dire qualcosa.
Senza Data Governance non c'è Data Management, è la visione di DAMA e la condivido completamente.
Non dobbiamo pensare alla governance dei dati solo per quanto riguarda la conformità e i regolamenti. Il GDPR e la RDA sono stati un buon argomento per dotare le grandi aziende di suite di Data Governance, ma anche le medie imprese devono sfruttare i loro dati e gestire i metadati in modo efficiente.

Che cosa porta? Cosa risolve?

Innanzitutto, la Data Governance ci prepara al processo di trasformazione digitale. Poiché i dati non sono più rinchiusi in sistemi proprietari, né in un'unica fonte di dati o data warehouse, la complessità delle organizzazioni moltiplica la quantità di informazioni e soprattutto mai come ora i dati sono il business.

In che cosa è diversa dalle altre metodologie?

Più che una metodologia, è un obbligo all'interno delle aziende che comprendono che il loro vantaggio competitivo risiede nei dati. Normalmente ha il suo ingresso nelle grandi aziende per i temi legati alla conformità a rimanere uno strumento fondamentale.

A cosa si applica?

La governance dei dati ci aiuta a prendere decisioni efficienti poiché rende le informazioni credibili e sicure. Che cos'è il margine lordo? Come viene calcolato? Dove trovo questi dati? Quali fonti mi assicurano di questi dati? Chi ha modificato questa misura?

Governo? Gestione? Metadati? Dati?

Senza un'orchestrazione o uno strumento di Data Governance è davvero difficile rispettare in modo affidabile i regolamenti sempre più restrittivi (GDPR, RDA) e migrare le aziende ad un vero concetto "data-driven". E non va dimenticato che sta diventando sempre più facile cambiare piattaforme tecnologiche o lavorare con più piattaforme tecnologiche allo stesso tempo. In entrambi gli scenari, è essenziale controllare gli asset informativi con una visione unificata. Dobbiamo farlo su tutti i dati se manteniamo un'efficiente gestione dei metadati e ci sono molti strumenti per farlo.

Esiste come disciplina?

Sì e deve essere qualcosa di centrale nell'organizzazione dei dati. É fortemente legata alla figura del CDO (inteso come Chief Data Officer). Con l'affermarsi di questo ruolo che acquisisce autorità e influenza alla pari di altri dirigenti, le organizzazioni si allontaneranno dal semplice utilizzo dei dati come risorsa e dell'analisi come strumenti di reporting e di supporto al processo decisionale. Il data management e l'analitica diventeranno il fulcro della strategia aziendale, del focus e degli investimenti.

È definita e gli esperti hanno una visione coerente?

Certo che lo è. Gli esperti hanno una visione coerente e precisa, il problema è trasmettere questa visione e queste buone pratiche all'interno delle aziende. Ci sono molti strumenti ma il problema non è la piattaforma tecnologica ma la mentalità. É un problema di cultura all'interno delle aziende.

É viva? É usata? É comprata?

É viva, viene utilizzata e viene acquistata ora e sarà acquistata principalmente nel 2019. Non si tratta di un fenomeno del momento. Gartner prevede che entro il 2022, il 90% delle strategie aziendali menzionerà esplicitamente l'informazione come bene aziendale critico e l'analitica come competenza essenziale. "La capacità di un'azienda di competere nell'economia digitale emergente richiederà decisioni più rapide e lungimiranti", afferma Douglas Laney, illustre analista VP di Gartner. "I leader nel campo dei dati e dell'analisi devono affermarsi nella pianificazione strategica aziendale per garantire che le competenze in materia di dati e analisi siano integrate nei piani aziendali di più alto livello rivolti al pubblico".

É riconosciuta?

Non è pienamente riconosciuta come un bene fondamentale all'interno delle imprese. Presto gli "strambi" saranno quei CIO o CDO che non hanno una politica di Data Governance.

Michele Iurillo, Founder di Synergo!, Country Manager di Querona in Italia e Spagna. Founder del Data Management Spain Summit e del Data Management Italian Summit



Digital Business

numero di 10/04/2019
SOMMARIO di questa settimana

Condividi su LinkedIn




Continua a sfogliare per il prossimo articolo -->