Equipe Datascience
La gouvernance des données est un ensemble de processus, rôles, politiques, normes et métriques qui garantissent la disponibilité, l'ergonomie, l'inter-opérabilité, la sécurité (i.e. confidentialité, intégrité, protection des données personnelles). .
Cela rend l'utilisation des données cohérente, fiable, efficace et efficiente.
La gestion des données est un sous-ensemble à part entière de pratiques, processus, systèmes et outils qui mettent en pratique la définition de la gouvernance des données.
ISO/IEC 11179 : les métadonnées sont des données précisant le sens et les détails techniques d'autres données : contenu, domaine de valeurs ou autres éléments sémantiques et de représentation.
Ma définition : les métadonnées sont des informations structurées qui décrivent un ou plusieurs aspects (le format, la taille, la finalité, etc.) d'une entité de données. En général, les métadonnées sont utlisées pour résumer des informations de base à propos des données qui peuvent faciliter la recheche, la traçabilité, l'utilisation et la gestion de données.
Les métadonnées descriptives détaillent le contenu et le sens des données. Elles aident l'utilisateur à découvrir et à comprendre les données.
Les métadonnées de contexte définissent le contexte, le but et le besoin. Elles sont le lien entre les objectifs organisationnels et les contraintes de conformité.
Les métadonnées de traçage établissent l'origine et les transformations des données. Elles permettent la traçabilité, l'analyse d'impact et le debogage.
Les métadonnées de propriété attribuent les responsabilités. Elles précisent les responsables de la qualité, de la conformité, de la résolution des problèmes.
Les métadonnées temporelles enregistrent la date et l'historique des versions. Elles facilitent l'audit, la conformité, et la prise de décision lié à la chronologie des données.
Elles définissent les contraintes d'utilisation, format, méthodes d'accès pour un usage sûr, licite et efficace.
De nombreux outils de gestion des métadonnées existent. Le CASD a testé les solutions open source.
Open Metadata est un outil de gestion des métadonnées open source et moderne. Il fournit :
La plateforme Open Metadata contient : une appli web, un SGBDR, un moteur de recherche et un gestionnaire de workflows.