{"id":5410,"date":"2022-08-08T07:08:24","date_gmt":"2022-08-08T15:08:24","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=5410"},"modified":"2022-08-08T07:13:48","modified_gmt":"2022-08-08T15:13:48","slug":"data-lineage-techniques-best-practices-tools","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/fr\/techniques-de-lignage-de-donnees-meilleures-pratiques-et-outils\/","title":{"rendered":"Techniques, bonnes pratiques et outils de lignage de donn\u00e9es | Gudu SQLFlow"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>Techniques, meilleures pratiques et outils de lignage de donn\u00e9es<\/h2>\n<p>Qu&#039;est-ce que <strong><a href=\"https:\/\/www.gudusoft.com\/fr\/logiciel-de-lignee-de-donnees-quest-ce-que-cest-pourquoi-en-avez-vous-besoin\/\">lign\u00e9e de donn\u00e9es<\/a><\/strong>? Quels sont les <strong>techniques de lignage de donn\u00e9es<\/strong>, bonnes pratiques et outils\u00a0? Dans cet article, nous r\u00e9pondrons \u00e0 ces questions une par une.<\/p>\n<p>La lign\u00e9e de donn\u00e9es documente le passage des donn\u00e9es \u00e0 travers les syst\u00e8mes informatiques d&#039;une entreprise, montrant comment elles circulent entre eux et les transforment pour diff\u00e9rents usages. Elle utilise <a href=\"https:\/\/www.gudusoft.com\/fr\/quest-ce-que-les-metadonnees\/\"><strong>m\u00e9tadonn\u00e9es<\/strong><\/a> (donn\u00e9es sur les donn\u00e9es) pour permettre aux utilisateurs finaux et aux professionnels de la gestion des donn\u00e9es de suivre l&#039;historique des actifs de donn\u00e9es et d&#039;obtenir des informations sur leur importance commerciale ou leurs attributs techniques.<\/p>\n<p>Par exemple, les enregistrements de lign\u00e9e de donn\u00e9es peuvent aider <a href=\"https:\/\/www.gudusoft.com\/fr\/scientifiques-des-donnees\/\"><strong>scientifiques des donn\u00e9es<\/strong><\/a>, autre <strong><a href=\"https:\/\/www.gudusoft.com\/fr\/competences-des-analystes-de-donnees\/\">analystes de donn\u00e9es<\/a><\/strong>, et les utilisateurs professionnels comprennent les donn\u00e9es qu&#039;ils utilisent et s&#039;assurent qu&#039;elles r\u00e9pondent \u00e0 leurs besoins d&#039;information. La tra\u00e7abilit\u00e9 des donn\u00e9es joue \u00e9galement un r\u00f4le important dans <strong><a href=\"https:\/\/www.gudusoft.com\/fr\/principles-of-data-governance\/\">gouvernance des donn\u00e9es<\/a><\/strong>, ma\u00eetre <strong><a href=\"https:\/\/www.gudusoft.com\/fr\/quest-ce-que-la-gestion-des-metadonnees\/\">gestion des donn\u00e9es<\/a><\/strong>et les programmes de conformit\u00e9. Ces initiatives simplifient notamment deux proc\u00e9dures cl\u00e9s de gouvernance des donn\u00e9es\u00a0: l&#039;analyse des causes profondes des <strong><a href=\"https:\/\/www.gudusoft.com\/fr\/best-data-quality-tools-software\/\">qualit\u00e9 des donn\u00e9es<\/a><\/strong> probl\u00e8mes et impact des modifications des ensembles de donn\u00e9es.<\/p>\n<div id=\"attachment_5416\" style=\"width: 946px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-5416\" decoding=\"async\" class=\"size-full wp-image-5416\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools.png\" alt=\"Techniques, meilleures pratiques et outils de lignage de donn\u00e9es\" width=\"936\" height=\"510\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-18x10.png 18w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-200x109.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-300x163.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-400x218.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-600x327.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-768x418.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-800x436.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools.png 936w\" sizes=\"(max-width: 936px) 100vw, 936px\" \/><p id=\"caption-attachment-5416\" class=\"wp-caption-text\">Techniques, meilleures pratiques et outils de lignage de donn\u00e9es<\/p><\/div>\n<p>Les informations sur la lign\u00e9e des donn\u00e9es sont principalement collect\u00e9es \u00e0 partir des syst\u00e8mes d&#039;exploitation (lors du traitement des donn\u00e9es) et \u00e0 partir de <a href=\"https:\/\/www.gudusoft.com\/fr\/data-warehouse-environment-modernization\/\"><strong>entrep\u00f4ts de donn\u00e9es<\/strong><\/a> et <strong><a href=\"https:\/\/www.gudusoft.com\/fr\/quest-ce-quun-lac-de-donnees\/\">lacs de donn\u00e9es<\/a><\/strong> \u2013 o\u00f9 sont stock\u00e9s les jeux de donn\u00e9es destin\u00e9s aux applications de BI et d&#039;analyse. Outre une documentation d\u00e9taill\u00e9e, des diagrammes de flux de donn\u00e9es et des sch\u00e9mas peuvent \u00eatre cr\u00e9\u00e9s pour fournir une vue visuelle de la tra\u00e7abilit\u00e9 des donn\u00e9es associ\u00e9e aux processus m\u00e9tier. Pour simplifier l&#039;acc\u00e8s des utilisateurs finaux aux informations de tra\u00e7abilit\u00e9, celles-ci sont souvent int\u00e9gr\u00e9es dans un <strong><a href=\"https:\/\/www.gudusoft.com\/fr\/quest-ce-que-le-catalogue-de-donnees-pourquoi-les-donnees-datalog\/\">catalogue de donn\u00e9es<\/a><\/strong>, qui r\u00e9pertorie les actifs de donn\u00e9es et les m\u00e9tadonn\u00e9es qui leur sont associ\u00e9es.<\/p>\n<h3>Pourquoi la lign\u00e9e des donn\u00e9es est-elle importante\u00a0?<\/h3>\n<p>Les informations sur la tra\u00e7abilit\u00e9 des donn\u00e9es sont essentielles \u00e0 la gestion et \u00e0 l&#039;analyse des donn\u00e9es. Les d\u00e9tails de la tra\u00e7abilit\u00e9 aident les entreprises \u00e0 g\u00e9rer et \u00e0 utiliser efficacement les donn\u00e9es. Sans acc\u00e8s \u00e0 ces informations, il sera difficile pour les entreprises d&#039;exploiter pleinement la valeur commerciale potentielle des donn\u00e9es.<\/p>\n<p>Voici les <a href=\"https:\/\/www.gudusoft.com\/fr\/benefits-of-data-lineage\/\"><strong>avantages offerts par la lign\u00e9e de donn\u00e9es<\/strong><\/a>:<\/p>\n<p>Analyses plus pr\u00e9cises et plus utiles. En permettant aux \u00e9quipes d&#039;analyse et aux utilisateurs m\u00e9tier de conna\u00eetre l&#039;origine et la signification des donn\u00e9es, la tra\u00e7abilit\u00e9 des donn\u00e9es am\u00e9liore leur capacit\u00e9 \u00e0 trouver plus rapidement les donn\u00e9es n\u00e9cessaires \u00e0 la BI et \u00e0 la data science. Cela permet d&#039;obtenir de meilleurs r\u00e9sultats analytiques et d&#039;accro\u00eetre la probabilit\u00e9 que les analyses de donn\u00e9es fournissent des informations pertinentes pour orienter les d\u00e9cisions commerciales.<\/p>\n<p>Meilleure gouvernance des donn\u00e9es. La tra\u00e7abilit\u00e9 des donn\u00e9es permet \u00e9galement de suivre les donn\u00e9es et d&#039;ex\u00e9cuter d&#039;autres \u00e9tapes cl\u00e9s du processus de gouvernance. Elle aide les responsables et les membres de l&#039;\u00e9quipe de gouvernance des donn\u00e9es \u00e0 garantir la validit\u00e9, la propret\u00e9 et la coh\u00e9rence des donn\u00e9es, ainsi que leur protection, leur gestion et leur utilisation appropri\u00e9es.<\/p>\n<p>Renforcement de la s\u00e9curit\u00e9 des donn\u00e9es et de la protection de la confidentialit\u00e9. Les entreprises peuvent utiliser les informations de tra\u00e7abilit\u00e9 des donn\u00e9es pour identifier les donn\u00e9es sensibles n\u00e9cessitant une s\u00e9curit\u00e9 particuli\u00e8rement renforc\u00e9e. Elles peuvent \u00e9galement servir \u00e0 d\u00e9finir diff\u00e9rents niveaux d&#039;acc\u00e8s utilisateur en fonction des politiques de s\u00e9curit\u00e9 et de confidentialit\u00e9 des donn\u00e9es, et \u00e0 \u00e9valuer les risques potentiels li\u00e9s aux donn\u00e9es dans le cadre d&#039;une strat\u00e9gie de gestion des risques d&#039;entreprise.<\/p>\n<p>Am\u00e9liorez la conformit\u00e9 r\u00e9glementaire. La tra\u00e7abilit\u00e9 des donn\u00e9es offre de meilleures protections de s\u00e9curit\u00e9, ce qui peut aider les entreprises \u00e0 se conformer aux lois sur la confidentialit\u00e9 des donn\u00e9es et autres r\u00e9glementations. Une tra\u00e7abilit\u00e9 des donn\u00e9es bien document\u00e9e facilite \u00e9galement la r\u00e9alisation d&#039;audits de conformit\u00e9 internes et la cr\u00e9ation de rapports de conformit\u00e9.<\/p>\n<p>Simplifier la gestion des donn\u00e9es. Outre l&#039;am\u00e9lioration de la qualit\u00e9 des donn\u00e9es, la tra\u00e7abilit\u00e9 des donn\u00e9es facilite diverses autres t\u00e2ches de gestion des donn\u00e9es. Parmi les exemples, on peut citer la gestion des migrations de donn\u00e9es, le d\u00e9mant\u00e8lement des silos de donn\u00e9es, ainsi que la d\u00e9tection et la correction des lacunes dans les ensembles de donn\u00e9es.<\/p>\n<h3>Lign\u00e9e des donn\u00e9es, classification des donn\u00e9es et provenance des donn\u00e9es<\/h3>\n<p>La lign\u00e9e des donn\u00e9es est \u00e9galement \u00e9troitement li\u00e9e aux deux processus de gestion des donn\u00e9es que sont la classification et la provenance des donn\u00e9es. Voyons ce que sont ces processus et en quoi ils diff\u00e8rent de la lign\u00e9e des donn\u00e9es et s&#039;y rapportent.<\/p>\n<ul>\n<li><strong>Classification des donn\u00e9es.<\/strong> Cela implique de classer les donn\u00e9es en diff\u00e9rentes cat\u00e9gories selon leurs caract\u00e9ristiques, principalement \u00e0 des fins de s\u00e9curit\u00e9 et de conformit\u00e9. La classification permet de classer les donn\u00e9es selon leur sensibilit\u00e9, par exemple\u00a0: informations personnelles, exclusives, confidentielles ou publiques. Cela permet de distinguer les ensembles de donn\u00e9es n\u00e9cessitant des niveaux de s\u00e9curit\u00e9 et des contr\u00f4les d&#039;acc\u00e8s plus stricts de ceux qui n&#039;en n\u00e9cessitent pas. Le lignage des donn\u00e9es fournit des informations sur un ensemble de donn\u00e9es qui aident \u00e0 le classer.<\/li>\n<li><strong>Provenance des donn\u00e9es.<\/strong> On la consid\u00e8re parfois comme synonyme de lignage des donn\u00e9es, tandis que la provenance des donn\u00e9es est per\u00e7ue comme une approche plus pr\u00e9cise de la provenance des donn\u00e9es, incluant leur syst\u00e8me source et leur mode de g\u00e9n\u00e9ration. Dans ce cas, lignage et provenance des donn\u00e9es peuvent fonctionner ensemble, cette derni\u00e8re fournissant une documentation de haut niveau sur l&#039;origine des donn\u00e9es et leur signification.<\/li>\n<\/ul>\n<h3>Lign\u00e9e et gouvernance des donn\u00e9es<\/h3>\n<p>L&#039;essence m\u00eame de la gouvernance des donn\u00e9es r\u00e9side dans la cr\u00e9ation de politiques de donn\u00e9es d&#039;entreprise et dans l&#039;assurance de leur respect par les individus. Ces politiques peuvent s&#039;\u00e9tendre \u00e0 l&#039;intention et inclure des directives concernant la protection, la v\u00e9rification et l&#039;utilisation des donn\u00e9es. Les responsables de la gouvernance des donn\u00e9es et <strong><a href=\"https:\/\/www.gudusoft.com\/fr\/gestionnaires-de-donnees\/\">gestionnaires de donn\u00e9es<\/a><\/strong> doit recueillir les besoins en donn\u00e9es des utilisateurs professionnels et travailler avec les membres du comit\u00e9 de gouvernance des donn\u00e9es d\u00e9cisionnel pour convenir de d\u00e9finitions communes des donn\u00e9es, sp\u00e9cifier les mesures de qualit\u00e9 des donn\u00e9es et d\u00e9velopper des politiques et des proc\u00e9dures connexes.<\/p>\n<p>Cependant, il existe un foss\u00e9 entre la d\u00e9finition des politiques de gouvernance des donn\u00e9es et leur d\u00e9ploiement, et combler ce foss\u00e9 constitue un d\u00e9fi majeur. C&#039;est l\u00e0 qu&#039;intervient la tra\u00e7abilit\u00e9 des donn\u00e9es. Elle documente les sources et les flux de donn\u00e9es, permettant aux \u00e9quipes de gouvernance de surveiller la circulation des donn\u00e9es dans le syst\u00e8me, ainsi que leur modification et leur utilisation. Les informations de tra\u00e7abilit\u00e9 les aident \u00e0 garantir la mise en place de contr\u00f4les de s\u00e9curit\u00e9 et d&#039;acc\u00e8s aux donn\u00e9es appropri\u00e9s, et \u00e0 stocker, maintenir et utiliser les donn\u00e9es conform\u00e9ment aux politiques de gouvernance.<\/p>\n<p>La tra\u00e7abilit\u00e9 des donn\u00e9es peut \u00e9galement simplifier certaines t\u00e2ches li\u00e9es \u00e0 la gouvernance. Par exemple, sans moyen de d\u00e9terminer o\u00f9 les erreurs de donn\u00e9es ont \u00e9t\u00e9 introduites dans le syst\u00e8me, il peut \u00eatre difficile pour les gestionnaires de donn\u00e9es et les analystes de la qualit\u00e9 des donn\u00e9es de les identifier et de les corriger. Cela a des cons\u00e9quences\u00a0: si les failles de donn\u00e9es ne sont pas d\u00e9tect\u00e9es, les entreprises peuvent se retrouver avec des r\u00e9sultats d&#039;analyse incoh\u00e9rents ou inexacts, ce qui peut entra\u00eener de mauvaises d\u00e9cisions.<\/p>\n<p>Dans l&#039;analyse des causes profondes des erreurs de donn\u00e9es, les enregistrements de tra\u00e7abilit\u00e9 offrent une visibilit\u00e9 sur la s\u00e9quence des \u00e9tapes de traitement d&#039;un ensemble de donn\u00e9es. Les entreprises peuvent v\u00e9rifier le niveau de qualit\u00e9 \u00e0 chaque \u00e9tape afin d&#039;identifier les sources d&#039;erreurs. En remontant \u00e0 partir du moment o\u00f9 l&#039;erreur a \u00e9t\u00e9 d\u00e9couverte, les gestionnaires de donn\u00e9es peuvent v\u00e9rifier si les donn\u00e9es r\u00e9pondent aux attentes initiales ou si elles contenaient des erreurs \u00e0 ce moment-l\u00e0. En identifiant pr\u00e9cis\u00e9ment l&#039;\u00e9tape o\u00f9 les donn\u00e9es sont conformes \u00e0 l&#039;entr\u00e9e, mais d\u00e9fectueuses \u00e0 la sortie, les \u00e9quipes impliqu\u00e9es dans un programme de gouvernance des donn\u00e9es peuvent \u00e9liminer la cause profonde des erreurs, et non pas simplement corriger les donn\u00e9es erron\u00e9es.<\/p>\n<p>La lign\u00e9e des donn\u00e9es est \u00e9galement utile lors de la r\u00e9alisation d&#039;une analyse d&#039;impact pour comprendre les probl\u00e8mes caus\u00e9s par les changements de format et de structure des donn\u00e9es sources, un probl\u00e8me courant dans l&#039;environnement de donn\u00e9es de plus en plus dynamique d&#039;aujourd&#039;hui.<\/p>\n<p>Toute modification des donn\u00e9es peut avoir des cons\u00e9quences impr\u00e9vues. En travaillant d\u00e8s la cr\u00e9ation ou la collecte des donn\u00e9es, les gestionnaires de donn\u00e9es peuvent s&#039;appuyer sur la documentation de tra\u00e7abilit\u00e9 des donn\u00e9es pour suivre leurs d\u00e9pendances et identifier les \u00e9tapes de traitement affect\u00e9es par les modifications. Ces \u00e9tapes peuvent ensuite \u00eatre repens\u00e9es pour s&#039;adapter aux changements et garantir la coh\u00e9rence des donn\u00e9es entre les syst\u00e8mes.<\/p>\n<h3>Techniques cl\u00e9s de lign\u00e9e de donn\u00e9es<\/h3>\n<p>Les entreprises peuvent utiliser diverses techniques pour collecter et enregistrer les informations de tra\u00e7abilit\u00e9 des donn\u00e9es. Ces techniques ne sont pas n\u00e9cessairement exclusives, et les entreprises peuvent utiliser plusieurs technologies de tra\u00e7abilit\u00e9, selon les exigences de leurs applications et la nature de leur environnement de donn\u00e9es. Les m\u00e9thodes disponibles incluent\u00a0:<\/p>\n<div id=\"attachment_5422\" style=\"width: 897px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-5422\" decoding=\"async\" class=\"size-full wp-image-5422\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2.png\" alt=\"Techniques, meilleures pratiques et outils de lignage de donn\u00e9es\" width=\"887\" height=\"512\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2-18x10.png 18w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2-200x115.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2-300x173.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2-400x231.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2-600x346.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2-768x443.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2-800x462.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2.png 887w\" sizes=\"(max-width: 887px) 100vw, 887px\" \/><p id=\"caption-attachment-5422\" class=\"wp-caption-text\">Techniques, meilleures pratiques et outils de lignage de donn\u00e9es<\/p><\/div>\n<p>Key Data Lineage Techniques &#8211; 1. Data tag. By examining metadata, labels can be applied to datasets to help describe and characterize them for data lineage purposes. Tagging can be done manually by data stewards, other data governance team members, and end users, or automatically by software. For example, data lineage tools and lineage capabilities built into data governance software often include automated algorithms\u2014that users can run to label datasets.<\/p>\n<p>Techniques cl\u00e9s de lignage de donn\u00e9es \u2013 2. Lignage bas\u00e9 sur des mod\u00e8les. Cette approche recherche des mod\u00e8les dans plusieurs ensembles de donn\u00e9es, tels que des \u00e9l\u00e9ments de donn\u00e9es, des lignes et des colonnes similaires. Leur pr\u00e9sence indique que les ensembles de donn\u00e9es sont li\u00e9s les uns aux autres et peuvent faire partie d&#039;un flux de donn\u00e9es, tandis que les diff\u00e9rences de valeurs ou d&#039;attributs de donn\u00e9es indiquent que les donn\u00e9es ont \u00e9t\u00e9 transform\u00e9es lors de leur transfert d&#039;un syst\u00e8me \u00e0 un autre. <a href=\"https:\/\/www.gudusoft.com\/fr\/quest-ce-que-la-transformation-des-donnees\/\"><strong>Transformations de donn\u00e9es<\/strong><\/a> et les flux de donn\u00e9es peuvent ensuite \u00eatre enregistr\u00e9s dans le cadre d&#039;un enregistrement de lign\u00e9e de donn\u00e9es.<\/p>\n<p>Techniques cl\u00e9s de lignage des donn\u00e9es \u2013 3. Lignage bas\u00e9 sur l&#039;analyse. Dans ce cas, les outils de lignage des donn\u00e9es analysent la logique de transformation des donn\u00e9es, les fichiers journaux d&#039;ex\u00e9cution, les workflows d&#039;int\u00e9gration de donn\u00e9es et d&#039;autres codes de traitement de donn\u00e9es pour identifier et extraire les informations de lignage. L&#039;analyse offre une approche de bout en bout pour le suivi du lignage des donn\u00e9es dans diff\u00e9rents syst\u00e8mes et peut \u00eatre plus pr\u00e9cise que le lignage bas\u00e9 sur les sch\u00e9mas, mais aussi plus complexe.<\/p>\n<p>Techniques cl\u00e9s de tra\u00e7abilit\u00e9 des donn\u00e9es \u2013 4. Une autre approche, enti\u00e8rement manuelle, consiste \u00e0 interroger les utilisateurs m\u00e9tier, les analystes BI, les data scientists, les gestionnaires de donn\u00e9es, les d\u00e9veloppeurs d&#039;int\u00e9gration de donn\u00e9es et d&#039;autres collaborateurs afin de comprendre comment les donn\u00e9es circulent dans le syst\u00e8me, sont utilis\u00e9es et modifi\u00e9es. Les informations recueillies peuvent servir \u00e0 cartographier les flux et les transformations de donn\u00e9es, et servir \u00e9ventuellement de point de d\u00e9part \u00e0 la planification de la tra\u00e7abilit\u00e9 des donn\u00e9es avant le d\u00e9ploiement de techniques plus automatis\u00e9es.<\/p>\n<h3>Meilleures pratiques en mati\u00e8re de lign\u00e9e de donn\u00e9es<\/h3>\n<p>Voici quelques bonnes pratiques pour vous aider \u00e0 maintenir le processus de lignage des donn\u00e9es sur la bonne voie et \u00e0 garantir qu&#039;il fournit des informations pr\u00e9cises et utiles sur votre ensemble de donn\u00e9es\u00a0:<\/p>\n<ul>\n<li>Impliquez les dirigeants et les utilisateurs d\u00e8s le d\u00e9part. Un programme de gouvernance des donn\u00e9es n\u00e9cessite le soutien et l&#039;implication de la direction pour r\u00e9ussir, tout comme la tra\u00e7abilit\u00e9 des donn\u00e9es. L&#039;obtention du soutien de la haute direction est une condition pr\u00e9alable \u00e0 l&#039;approbation et au financement. Les dirigeants et les employ\u00e9s doivent \u00e9galement \u00eatre impliqu\u00e9s afin de garantir que les \u00e9quipes de gestion des donn\u00e9es comprennent parfaitement l&#039;utilisation des donn\u00e9es dans les processus m\u00e9tier et de v\u00e9rifier la pertinence et la validit\u00e9 des informations de tra\u00e7abilit\u00e9 des donn\u00e9es.<\/li>\n<li>Documentez le lignage des donn\u00e9es m\u00e9tier et techniques. Le lignage m\u00e9tier s&#039;int\u00e9resse particuli\u00e8rement \u00e0 la provenance des donn\u00e9es, \u00e0 leur circulation et \u00e0 leur contexte m\u00e9tier. Le lignage technologique fournit des d\u00e9tails sur les transformations, les int\u00e9grations et les pipelines de donn\u00e9es, ainsi qu&#039;une combinaison de vues de lignage au niveau des tables, des colonnes et des requ\u00eates. La collecte de ces deux informations fournit des informations utiles aux utilisateurs m\u00e9tier et aux \u00e9quipes d&#039;analyse, d&#039;une part, et aux architectes de donn\u00e9es, mod\u00e9lisateurs de donn\u00e9es, analystes de la qualit\u00e9 des donn\u00e9es et autres professionnels de l&#039;informatique, d&#039;autre part.<\/li>\n<li>Corr\u00e9lez la tra\u00e7abilit\u00e9 des donn\u00e9es aux besoins m\u00e9tier et informatiques r\u00e9els. La tra\u00e7abilit\u00e9 des donn\u00e9es ne doit pas \u00eatre un exercice th\u00e9orique. Pour g\u00e9n\u00e9rer les b\u00e9n\u00e9fices escompt\u00e9s, elle doit contribuer \u00e0 am\u00e9liorer les d\u00e9cisions et les strat\u00e9gies m\u00e9tier, ainsi qu&#039;\u00e0 une gouvernance et une qualit\u00e9 des donn\u00e9es plus efficaces et \u00e0 d&#039;autres avantages en mati\u00e8re de gestion des donn\u00e9es. Dans le cas contraire, il s&#039;agira probablement d&#039;un investissement gaspill\u00e9.<\/li>\n<li>D\u00e9ployer une approche de tra\u00e7abilit\u00e9 des donn\u00e9es \u00e0 l&#039;\u00e9chelle de l&#039;entreprise. Se concentrer sur le processus de tra\u00e7abilit\u00e9 de certains ensembles de donn\u00e9es n&#039;est pas aussi utile qu&#039;il pourrait l&#039;\u00eatre. Pour \u00eatre vraiment rentable, il faut un effort global impliquant toutes les donn\u00e9es de l&#039;entreprise, avec un r\u00e9f\u00e9rentiel de m\u00e9tadonn\u00e9es unique pour soutenir le tra\u00e7abilit\u00e9.<\/li>\n<li>Cr\u00e9ez un catalogue de donn\u00e9es contenant des informations de tra\u00e7abilit\u00e9 int\u00e9gr\u00e9es. Trouver et comprendre des donn\u00e9es pertinentes repr\u00e9sente souvent un d\u00e9fi majeur pour les utilisateurs de BI et d&#039;analytique. En cr\u00e9ant un catalogue de donn\u00e9es, les \u00e9quipes de gestion des donn\u00e9es peuvent leur fournir un inventaire des donn\u00e9es disponibles, incluant \u00e9galement des informations de tra\u00e7abilit\u00e9.<\/li>\n<\/ul>\n<h3>Que rechercher dans un outil de lignage de donn\u00e9es\u00a0?<\/h3>\n<p>Manually collecting metadata and documenting data lineage requires a significant investment of resources. It&#8217;s also error-prone and can cause big problems, especially as businesses increasingly rely on data analytics to drive business operations. Therefore, to do a better job of data governance, one should look for tools to manage data lineage representations and map them automatically across the enterprise.<\/p>\n<p>Si vous d\u00e9cidez d&#039;aller de l&#039;avant avec le processus d&#039;\u00e9valuation technique en vue d&#039;un \u00e9ventuel achat, vous devez rechercher des outils de lign\u00e9e de donn\u00e9es capables de :<\/p>\n<ul>\n<li>Acc\u00e9der localement \u00e0 une large gamme de sources de donn\u00e9es et de produits de donn\u00e9es, \u00e9tudier les m\u00e9tadonn\u00e9es qu&#039;ils contiennent et les collecter pour la gouvernance des donn\u00e9es, de plus en plus gr\u00e2ce \u00e0 l&#039;utilisation d&#039;algorithmes d&#039;intelligence artificielle et d&#039;apprentissage automatique ;<\/li>\n<li>Regrouper les m\u00e9tadonn\u00e9es captur\u00e9es dans un r\u00e9f\u00e9rentiel centralis\u00e9\u00a0;<\/li>\n<li>D\u00e9duire les types de donn\u00e9es et faire correspondre les utilisations courantes des donn\u00e9es de r\u00e9f\u00e9rence aux \u00e9l\u00e9ments de donn\u00e9es de diff\u00e9rents syst\u00e8mes\u00a0;<\/li>\n<li>Fournir aux utilisateurs finaux une pr\u00e9sentation simplifi\u00e9e des m\u00e9tadonn\u00e9es agr\u00e9g\u00e9es et soutenir la collaboration pour valider les descriptions des m\u00e9tadonn\u00e9es\u00a0;<\/li>\n<li>Une cartographie de bout en bout de la mani\u00e8re dont les donn\u00e9es circulent dans les syst\u00e8mes d\u2019une organisation\u00a0;<\/li>\n<li>G\u00e9n\u00e9rer une repr\u00e9sentation visuelle de la lign\u00e9e des donn\u00e9es\u00a0;<\/li>\n<li>Fournit une API permettant aux d\u00e9veloppeurs de cr\u00e9er des applications capables d\u2019interroger les enregistrements de lign\u00e9e\u00a0;<\/li>\n<li>Cr\u00e9ez des index invers\u00e9s qui mappent les noms des \u00e9l\u00e9ments de donn\u00e9es \u00e0 leurs utilisations \u00e0 diff\u00e9rentes \u00e9tapes du traitement\u00a0;<\/li>\n<li>Fournir des capacit\u00e9s de recherche pour suivre rapidement le flux de donn\u00e9es d&#039;un point source de donn\u00e9es vers une cible en aval\u00a0;<\/li>\n<li>Permet aux utilisateurs de surveiller le flux de donn\u00e9es vers l&#039;avant et vers l&#039;arri\u00e8re.<\/li>\n<\/ul>\n<h3>Conclusion<\/h3>\n<p>Merci d&#039;avoir lu notre article et nous esp\u00e9rons qu&#039;il vous aidera \u00e0 mieux comprendre les techniques, les bonnes pratiques et les outils de tra\u00e7abilit\u00e9 des donn\u00e9es. Pour en savoir plus sur les techniques et les outils de tra\u00e7abilit\u00e9 des donn\u00e9es, nous vous conseillons de consulter notre site. <a href=\"https:\/\/sqlflow.gudusoft.com\/#\/\" rel=\"dofollow\"><strong>Gudu SQLFlow<\/strong><\/a> pour plus d&#039;informations.<\/p>\n<p>En tant que l&#039;un des meilleurs outils de lign\u00e9e de donn\u00e9es disponibles sur le march\u00e9 aujourd&#039;hui, Gudu SQLFlow peut non seulement analyser les fichiers de script SQL, obtenir la lign\u00e9e des donn\u00e9es et effectuer un affichage visuel, mais \u00e9galement permettre aux utilisateurs de fournir la lign\u00e9e des donn\u00e9es au format CSV et d&#039;effectuer un affichage visuel. <strong>(Publi\u00e9 par Ryan le 8 ao\u00fbt 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":5425,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[178],"tags":[350,137,55,348,347,285,56,75,351,349],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/posts\/5410"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/comments?post=5410"}],"version-history":[{"count":15,"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/posts\/5410\/revisions"}],"predecessor-version":[{"id":5429,"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/posts\/5410\/revisions\/5429"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/media\/5425"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/media?parent=5410"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/categories?post=5410"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/fr\/wp-json\/wp\/v2\/tags?post=5410"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}