Différents types de métadonnées
Les métadonnées sont des données utilisées pour définir les types de données. Elles décrivent principalement les informations des données elles-mêmes, notamment leur source, leur taille, leur format et d'autres caractéristiques. Dans les champs de base de données, les métadonnées servent à interpréter le contenu de la base. Lorsque lac de données Insight (DLI) crée une table et définit des métadonnées, composées de trois colonnes : nom de la colonne, type et description. Dans cet article, nous examinerons de plus près les différentes types de métadonnées et comment ils sont utilisés.

Types de métadonnées
1. Classification par types de métadonnées
- Métadonnées sur les données de base : Les données de base font référence à toutes les données gérées par des sources de données, entrepôts de données, datamarts, et applications. Les métadonnées des données de base comprennent la définition et la description complète de la structure.
- Métadonnées pour le traitement des données : informations sur le chargement des données, le traitement des mises à jour, le traitement analytique et la gestion, comme l'extraction des données, transformation des données, et les règles d'agrégation.
- Métadonnées sur la structure organisationnelle de l'entreprise : elles incluent spécifiquement les données de gestion et les informations relatives à l'entreprise, telles que l'accès des utilisateurs aux entrepôts de données, aux sources de données et aux informations d'autorisation des datamarts.
2. Classification par niveau d'abstraction
- Métadonnées au niveau du concept : Il comprend la description complète de l'entreprise, comme la définition des principales entités commerciales, des caractéristiques et de leurs interrelations, l'utilisation du système, les requêtes définies, les vues et les applications existantes.
- Métadonnées de niveau logique : Il comprend le schéma relationnel de la base de données, le modèle logique multidimensionnel, etc., et les règles d'extraction/transformation des données sont généralement décrites en pseudo-code ou en langage mathématique.
- Métadonnées de niveau physique : Cela inclut le code SQL correspondant aux règles métier, les fichiers d'index pour les relations et le code pour les applications analytiques.
3. Classification par tâches entreprises par métadonnées
Selon la classification des tâches des métadonnées dans l'entrepôt de données, elles peuvent être divisées en métadonnées statiques et métadonnées dynamiques.
Métadonnées statiques est principalement lié aux structures de données et comprend les éléments suivants :
- Nom-classe : un symbole utilisé pour différencier les données lors de l'identification du système.
- Description-classe : Décrit divers éléments de données dans l'entrepôt de données.
- Format-classe : Fournit les règles d'expression des données dans l'entrepôt de données.
- Type de données : Le type de données dans l'entrepôt de données.
- Relation-classe : Décrit la relation entre les différents objets de données de l'entrepôt de données. Par exemple, une relation d'achat entre un client et un article.
- Classe de domaine : Utilisé pour décrire la plage de valeurs valide pour les données dans l'entrepôt de données.
- Classe de règles métier : Utilisé pour décrire les règles que les données de l'entrepôt de données doivent respecter lors du traitement des données. Par exemple, « Customer_ID » représente le numéro du client, commençant par A pour les clients collectifs et B pour les clients individuels.
Métadonnées dynamiques est principalement lié à l'état et à l'utilisation des données, y compris les éléments suivants :
- Qualité des données tableau: Utilisé pour décrire l'exactitude, l'exhaustivité, la cohérence et la validité des données dans l'entrepôt de données.
- Informations statistiques : Comptez les utilisateurs accédant aux données, leur temps d'accès et leur nombre. Ces statistiques constituent une référence importante pour l'amélioration des performances de l'entrepôt de données.
- Classe de statut : Utilisé pour suivre l'état de santé de l'entrepôt de données. Par exemple, l'heure de la dernière sauvegarde des données, le temps nécessaire à la sauvegarde, les conditions d'erreur, etc. L'état de fonctionnement de ces systèmes aide les responsables de l'entrepôt de données à comprendre ses performances.
- Classe de traitement : Utilisé pour décrire les caractéristiques d'utilisation et de gestion du système d'entrepôt de données. Par exemple, comment utiliser les données, une formule générale résumant les données, etc.
4. Classification du point de vue de l'utilisateur
Cette méthode de classification est liée à l'usage des métadonnées. Du point de vue de l'utilisateur, cette méthode de classification ne dispose pas d'une norme unifiée et, en pratique, elle est souvent divisée selon des critères d'habitude, de faisabilité et d'application.
On le divise généralement en deux catégories : métadonnées techniques et métadonnées commercialesLes métadonnées techniques concernent le développement, la maintenance et la gestion de toutes les métadonnées d'analyse, de conception, de développement, de gestion et autres métadonnées étroitement liées à la technologie dans l'environnement informatique. Elles constituent le lien technique entre les outils de développement, les applications et les systèmes. Les métadonnées métier facilitent la compréhension des services d'une entreprise pour les utilisateurs finaux, en facilitant la navigation et l'interrogation des données pour l'interprétation des objectifs et des processus métier.
Métadonnées techniques inclut les données de description des bases de données, des entrepôts de données, des dictionnaires de données des datamarts, des codes de règles de conversion de données, etc. Par exemple :
- Informations descriptives sur l'architecture et le schéma du système d'exploitation, de l'entrepôt de données et du système OLAP, de la structure de la table, des restrictions d'attributs, des informations d'affichage, etc.
- Une description des mappages et des dépendances au niveau physique et de l'implémentation entre différentes sources d'informations, entrepôts de données et systèmes OLAP.
- Extraire les métadonnées de planification, y compris l'extraction de la relation complexe de planification, le mappage entre les données source et les données cible.
- Métadonnées pour la synchronisation temporelle.
- Informations sur les autorisations de l'utilisateur.
Métadonnées commerciales inclut la documentation spécifique à l'application (profils utilisateur, cartes de stockage, conseils d'utilisation, aides à la navigation, etc.), les concepts et termes commerciaux, les détails des requêtes et rapports prédéfinis, les informations contextuelles, les descriptions des poids et mesures, les formats de date, les dictionnaires, le tableau des rubriques, etc. Par exemple :
- Modèle de concept d'entreprise.
- Modèle de données multidimensionnel, principes d'agrégation des dimensions, catégories de dimensions, cubes de données, datamarts.
- Dépendances entre les modèles conceptuels d’entreprise et les modèles physiques.
- Prend en charge la navigation et la navigation pour les concepts commerciaux.
- Prise en charge de la navigation et de la navigation orientées vers les concepts commerciaux.
- Prise en charge des requêtes immédiates dynamiques et exploration de données.
Conclusion
Merci d'avoir lu notre article et nous espérons qu'il pourra vous aider à mieux comprendre les différents types de métadonnées et leur utilisation. Pour en savoir plus sur les différents types de métadonnées, nous vous conseillons de consulter Gudu SQLFlow pour plus d'informations.
En tant que l'un des meilleurs outils de lignage de données Disponible sur le marché aujourd'hui, Gudu SQLFlow peut non seulement analyser les fichiers de script SQL, mais aussi obtenir lignée de données, et effectuer un affichage visuel, mais permettent également aux utilisateurs de fournir une lignée de données au format CSV et d'effectuer un affichage visuel. (Publié par Ryan le 26 juin 2022)
Commentaires 2
Laissez un commentaire
Si vous aimez lire ceci, alors n'hésitez pas à explorer nos autres articles ci-dessous :
[…] avec des capacités de modélisation de données flexibles, fournit une vue centralisée de toutes les relations entre les types de données, clarifie les relations inter-domaines complexes et fournit des données de base multi-domaines flexibles […]
[…] les différents types de métadonnées aideront les analystes de données à comprendre comment appliquer les données à différents scénarios métier. Plus […]