Gestion des métadonnées d'entreprise

De nombreuses entreprises ont aujourd'hui compris qu'il est difficile d'améliorer leurs capacités d'innovation grâce au Big Data, car leurs équipes ne peuvent pas comprendre les données stockées dans le système. Cet article propose une solution à ce problème : entreprise gestion des métadonnées.

Table des matières:

  •  Une « barrière sémantique » apparaît entre les ordinateurs et les humains ;
  •  Métadonnées commerciales – le contexte commercial derrière les données ;
  • Pratique de gestion des métadonnées d'entreprise basée sur l'ontologie ;
  • Résumé et perspectives.
Gestion des métadonnées d'entreprise

Gestion des métadonnées d'entreprise

1. Une « barrière sémantique » apparaît entre les ordinateurs et les humains.

Il y a environ 70 ans, le jour de la Saint-Valentin, l'ENIAC voyait le jour à l'Université de Pennsylvanie. Depuis, l'humanité a commencé à explorer l'intelligence des ordinateurs. Diverses technologies, telles que la reconnaissance du langage, la reconnaissance d'images et le traitement automatique du langage naturel, sont de plus en plus matures. Nous pouvons saisir presque toutes les informations souhaitées dans un système informatique, mais pouvons-nous, en retour, interpréter correctement les données de sortie ?

À mesure que les données se sont multipliées, il est devenu difficile d'en comprendre le sens précis ; une barrière sémantique s'est créée entre nous et les systèmes informatiques. L'existence de ces barrières sémantiques pose une série de problèmes aux entreprises :

  • Compréhension incohérente de l'entreprise : La compréhension incohérente de l'entreprise par les employés est très courante dans les entreprises. Une compréhension incohérente des termes commerciaux empêche les employés de communiquer, ce qui entraîne des malentendus et réduit l'efficacité de la communication. Lors de la prise de décision en réunion, une compréhension incohérente des dirigeants peut conduire à des décisions erronées. Dans les statistiques des services, une compréhension incohérente des définitions commerciales peut conduire à des incohérences dans les méthodes statistiques. L'incohérence entraîne des statistiques inexactes et affecte même les résultats statistiques de plusieurs indicateurs et KPI de l'entreprise.
  • Trouver l'information est difficile : à l'ère du big data, la quantité de données d'entreprise croît de manière exponentielle, et trouver l'information pour les employés s'apparente de plus en plus à « chercher une aiguille dans une botte de foin ». Selon les statistiques, les employés passent chaque jour entre 151 et 351 TP2T de leur temps à rechercher les données dont ils ont besoin parmi une masse d'informations considérable, et seulement moins de 501 TP2T des résultats de recherche répondent à leurs besoins. Dans la plupart des cas, les résultats de recherche sont insatisfaisants. L'inaccessibilité des informations stockées entraîne souvent des doublons inutiles.
  • Pertes de personnel importantes : selon les statistiques, le taux de rotation annuel moyen des employés dans les entreprises est d'environ 121 TP2T. En l'absence de méthodes de gestion d'entreprise, les entreprises consacrent souvent beaucoup de temps et d'argent à la formation de nouveaux employés, après avoir recruté des employés maîtrisant parfaitement l'informatique, ce qui entraîne une perte de connaissances et une perte d'argent considérables.

En fin de compte, l'émergence de cette série de problèmes est due au fait que les employés des entreprises ne peuvent pas lire les données de l'ordinateur. Pour éviter ces problèmes, les entreprises doivent briser la barrière sémantique entre les ordinateurs et les personnes et transformer les données informatiques en un langage professionnel compréhensible par le personnel. Métadonnées commerciales est la clé pour résoudre le problème.

2. Métadonnées commerciales – le contexte commercial derrière les données.

Pour clarifier ce que sont les métadonnées d'entreprise, il convient de commencer par leur classification. Actuellement, une méthode de classification reconnue par le secteur consiste à diviser les métadonnées en deux types : les métadonnées techniques et les métadonnées d'entreprise.

Le métadonnées techniques comprend : le nom du champ, la longueur du champ, la structure de la table de base de données, etc.

Le métadonnées commerciales comprend : le nom de l'entreprise, la définition de l'entreprise, la description de l'entreprise, etc.

Les gens d’affaires accordent plus d’attention au contenu lié au « client », à la « date de règlement », au « montant de la vente », etc., qui sont difficiles à refléter à partir des métadonnées techniques.

Les métadonnées métier utilisent le nom, la définition, la description et d'autres informations de l'entreprise pour représenter divers attributs et concepts dans l'environnement de l'entreprise. Dans une certaine mesure, le contexte métier sous-jacent à toutes les données peut être considéré comme des métadonnées métier. Comparées aux métadonnées techniques, les métadonnées métier permettent aux utilisateurs de mieux comprendre et exploiter les données dans l'environnement de l'entreprise. Par exemple, la consultation des métadonnées métier permet aux utilisateurs de comprendre clairement la signification de chaque indicateur et sa méthode de calcul.

Les métadonnées d'entreprise sont largement répandues dans l'environnement des entreprises. Les principales sources de métadonnées d'entreprise sont :

  • ERP : Le système ERP d'entreprise stocke une grande quantité de métadonnées commerciales, telles que les formules de calcul financier, la logique des processus, les règles commerciales, etc.
  • Rapport : l'en-tête du rapport est également une sorte de métadonnées commerciales, en particulier les colonnes contenant des propriétés récapitulatives telles que les totaux et les moyennes, ainsi que certaines formules de calcul dans le rapport.
  • Tableau : Tout comme les rapports, les en-têtes et formules Excel constituent des métadonnées métier importantes. Contrairement aux rapports, la plupart des tableaux comportent une seule colonne « Description », et certains contiennent également une colonne « Code » et « Description du code », qui sont des métadonnées métier utiles.
  • Fichier : Il y a des métadonnées commerciales partout dans le fichier, telles que le titre, l'auteur, l'heure de modification, etc. Il est relativement difficile d'obtenir des métadonnées commerciales dans le contenu du fichier, impliquant des technologies telles que l'apprentissage automatique.
  • Outils BI : L'opération souvent utilisée en BI est le « forage ». Ce type d'exploration permet généralement de définir différentes structures de classification de l'entreprise, telles que le niveau produit et le niveau structurel, qui constituent des métadonnées métier essentielles.
  • Entrepôt de donnéesLes métadonnées métier existent également dans les entrepôts de données. Par exemple, la création d'un entrepôt de données nécessite souvent de nombreuses recherches sur la manière d'intégrer plusieurs sources de données, et les fichiers liés à la construction de l'entrepôt contiennent de nombreuses métadonnées métier.

Actuellement, la plupart des entreprises se concentrent uniquement sur les métadonnées techniques, négligeant la gestion des métadonnées métier. Ces métadonnées manquent de pertinence métier et sont difficiles à comprendre, sauf pour les techniciens. Par exemple, « rec_temp_fld_a » peut représenter un champ et « 236IN_TAB » une table de la base de données. Difficile d'apporter des bénéfices à l'entreprise. Les métadonnées métier peuvent représenter la signification métier des données. Les entreprises doivent prêter attention à la gestion des métadonnées métier tout en gérant leurs métadonnées techniques.

Comparées aux métadonnées techniques, les sources de métadonnées métier sont plus complexes et dispersées dans tous les aspects de l'environnement de l'entreprise. Pour gérer ces métadonnées, les entreprises ont besoin de méthodes et de moyens efficaces.

3. Pratique de gestion des métadonnées d’entreprise basée sur l’ontologie.

La définition d'une ontologie, relativement reconnue par le secteur, est la suivante : spécification formelle claire d'un modèle conceptuel partagé. Parmi ces définitions, le modèle conceptuel est un modèle obtenu par abstraction de certains phénomènes du monde objectif, ce qui constitue l'abstraction et la simplification de ce monde ; le partage signifie que les connaissances décrites dans l'ontologie ne sont pas exclusives à des individus, mais reconnues dans le domaine ; explicite signifie que les types de concepts utilisés et les contraintes d'utilisation des concepts sont clairement définis ; formel signifie que l'ontologie est lisible par machine et compréhensible par l'homme.

En résumé, l’ontologie peut analyser les objets du domaine et découvrir la relation entre ces objets, afin de décrire l’activité dans ce domaine de manière claire et formelle.

À gérer les métadonnées de l'entreprise L'utilisation de l'ontologie nécessite de prêter attention à trois points clés : la construction de l'ontologie, le stockage de l'ontologie et l'utilisation de l'ontologie.

1. Construction – Construisez automatiquement une ontologie à l’aide de la gestion des métadonnées.

La méthode traditionnelle de création d'ontologies consiste à trier manuellement l'ontologie du domaine métier selon les recommandations des experts métier. Cette méthode de tri manuel présente plusieurs problèmes :

  • Problème d'efficacité : dans l'environnement du Big Data, les données sont complexes, les sources sont diverses et les domaines d'activité ne cessent de croître. La rapidité du tri manuel ne répond plus aux besoins des entreprises.
  • Problème d'outils : les experts métier manquent d'outils dotés de capacités d'automatisation, ce qui entraîne la construction d'ontologies complexes qui consomment beaucoup de temps et ressources.
  • Données tierces : les experts d'entreprise ne comprennent pas les activités liées aux données tierces, il est donc difficile de terminer la construction de l'ontologie associée.

Dans l'environnement du Big Data, les entreprises ont besoin d'une nouvelle méthode de construction d'ontologies. Grâce à des outils de gestion des métadonnées, elles peuvent extraire automatiquement les métadonnées de leurs systèmes applicatifs et de divers documents. Une fois l'ontologie initialement créée, elle est ensuite transmise à des experts métier pour une seconde révision, et la construction de l'ontologie d'entreprise est enfin achevée.

2. Stockage – basé sur MOF pour implémenter l'ontologie de stockage de spécification OWL.

Le stockage de l'ontologie doit reposer sur certaines normes, et la méthode de stockage doit être flexible et extensible. La spécification OWL, recommandée par le W3C, est aujourd'hui largement reconnue pour le stockage et l'échange d'ontologies. Nos métadonnées étant basées sur MOF, le métamodèle OWL peut être intégré au métamodèle, permettant ainsi le stockage et la gestion de l'ontologie dans la base de métadonnées.

Les métadonnées techniques et l'ontologie étant stockées dans la base de données de métadonnées, l'ontologie a été extraite des métadonnées techniques. Il est ainsi facile d'établir la relation entre l'ontologie et les métadonnées techniques, permettant ainsi aux équipes métier de comprendre clairement la signification métier des données.

3. Utilisation – obtenir un contexte commercial grâce à des services de métadonnées commerciales.

Enfin, le service de métadonnées commerciales doit être fourni à tout le personnel de l'entreprise, intégré dans l'environnement de travail du personnel de l'entreprise, afin que le personnel de l'entreprise puisse rapidement comprendre les données d'un point de vue commercial, aidant ainsi le personnel de l'entreprise à mieux utiliser les données.

4. Résumé et perspectives

Pour conclure, je résumerai en une phrase. Les métadonnées métier sont la clé de la gestion future des métadonnées. À l'ère du big data, les entreprises doivent renforcer leur gestion. Elles peuvent utiliser des moyens automatisés pour gérer les métadonnées métier en s'appuyant sur des ontologies et les intégrer. Les données sont fournies aux équipes métier sous forme de services pour les aider à optimiser leur utilisation.

Conclusion

Merci d'avoir lu notre article et nous espérons qu'il vous aidera à mieux comprendre la gestion des métadonnées d'entreprise. Pour en savoir plus sur la gestion des métadonnées, nous vous conseillons de consulter notre site. Gudu SQLFlow pour plus d'informations.

En tant que l'un des meilleurs outils de lignage de données Disponible sur le marché aujourd'hui, Gudu SQLFlow peut non seulement analyser les fichiers de script SQL, obtenir la lignée des données et effectuer un affichage visuel, mais également permettre aux utilisateurs de fournir lignée de données au format CSV et effectuer un affichage visuel. (Publié par Ryan le 30 juin 2022)

Essayez Gudu SQLFlow Live

Version SQLFlow Cloud

Abonnez-vous à la newsletter hebdomadaire

Laissez un commentaire