{"id":5700,"date":"2022-08-29T06:08:31","date_gmt":"2022-08-29T14:08:31","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=5700"},"modified":"2022-08-29T06:09:46","modified_gmt":"2022-08-29T14:09:46","slug":"everything-you-need-to-know-about-data-lineage","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/de\/alles-was-sie-uber-die-datenherkunft-wissen-mussen\/","title":{"rendered":"Alles, was Sie \u00fcber die Datenherkunft wissen m\u00fcssen"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>Alles, was Sie \u00fcber die Datenherkunft wissen m\u00fcssen<\/h2>\n<p>Was ist <a href=\"https:\/\/www.gudusoft.com\/de\/data-lineage-software-was-ist-das-und-warum-wird-es-benotigt\/\"><strong>Datenherkunft<\/strong><\/a>Was sind die Merkmale der Datenherkunft? Wof\u00fcr werden Datenherkunftsinformationen verwendet? Welche Methoden gibt es zur Datenherkunftserfassung? Wenn Sie Antworten auf diese Fragen suchen, sind Sie hier richtig. In diesem Artikel gehen wir detailliert auf Folgendes ein: <strong>alles, was Sie \u00fcber die Datenherkunft wissen m\u00fcssen<\/strong>.<\/p>\n<div id=\"attachment_5704\" style=\"width: 827px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-5704\" decoding=\"async\" class=\"size-full wp-image-5704\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage.png\" alt=\"Alles, was Sie \u00fcber die Datenherkunft wissen m\u00fcssen\" width=\"817\" height=\"506\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage-18x12.png 18w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage-200x124.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage-300x186.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage-400x248.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage-600x372.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage-768x476.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage-800x495.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage.png 817w\" sizes=\"(max-width: 817px) 100vw, 817px\" \/><p id=\"caption-attachment-5704\" class=\"wp-caption-text\">Alles, was Sie \u00fcber die Datenherkunft wissen m\u00fcssen<\/p><\/div>\n<p><strong>Alles, was Sie \u00fcber Datenherkunft wissen m\u00fcssen \u2013 Was ist Datenherkunft?<\/strong><\/p>\n<p>Im gesamten Prozess der Datengenerierung, -verarbeitung, -integration, -zirkulation und -vernichtung entsteht auf nat\u00fcrliche Weise eine Beziehung zwischen Daten. Diese Beziehung zwischen Daten wird durch die Nutzung einer \u00e4hnlichen Beziehung in der menschlichen Gesellschaft ausgedr\u00fcckt, die als Datenherkunftsbeziehung bezeichnet wird. Die Datenherkunft ist eine der Komponenten von <a href=\"https:\/\/www.gudusoft.com\/de\/was-sind-metadaten\/\"><strong>Metadaten<\/strong><\/a>.<\/p>\n<p>Damit l\u00e4sst sich der Herkunftspfad der Tabelle und der Felder von der Datenquelle zur aktuellen Tabelle analysieren. Au\u00dferdem l\u00e4sst sich feststellen, ob die Beziehung zwischen den Herkunftsfeldern erf\u00fcllt ist, wie die Datenkonsistenz aussieht und wie rational das Tabellendesign ist. Au\u00dferdem l\u00e4sst sich damit die Auswirkung von \u00c4nderungen an Upstream-Daten auf Downstream-Daten analysieren und die Ursache von Upstream-Problemen ermitteln, wenn \u00c4nderungen an Downstream-Daten auftreten.<\/p>\n<p><strong> Alles, was Sie \u00fcber Data Lineage wissen m\u00fcssen \u2013 Die Merkmale der Data Lineage<\/strong><\/p>\n<ol>\n<li>Zuordnung: Im Allgemeinen geh\u00f6ren bestimmte Daten einer bestimmten Organisation oder Einzelperson und die Daten verf\u00fcgen \u00fcber eine Zuordnung.<\/li>\n<li>Mehrere Quellen: Dieselben Daten k\u00f6nnen aus mehreren Quellen stammen. Ein Datenelement kann durch die Verarbeitung mehrerer Daten generiert werden, und dieser Verarbeitungsprozess kann mehrfach sein.<\/li>\n<li>R\u00fcckverfolgbarkeit: Die Datenherkunftsbeziehung spiegelt den Lebenszyklus der Daten wider und bildet den gesamten Prozess der Daten von der Erstellung bis zur L\u00f6schung ab, einschlie\u00dflich R\u00fcckverfolgbarkeit.<\/li>\n<li>Hierarchisch: Die Datenherkunftsbeziehungen sind hierarchisch. Die Beschreibungsinformationen der Daten, wie Klassifizierung, Induktion und Zusammenfassung der Daten, bilden neue Daten, und die Beschreibungsinformationen unterschiedlichen Grades bilden die Ebene der Daten.<\/li>\n<\/ol>\n<p><strong> Alles, was Sie \u00fcber Data Lineage wissen m\u00fcssen \u2013 Die Verwendung von Data Lineage<\/strong><\/p>\n<ol>\n<li>Datenr\u00fcckverfolgbarkeit: Die Datenherkunft spiegelt die Details der Daten wider und hilft uns, die Datenquelle und den Datenverarbeitungsprozess zu verfolgen. Bei Datenabweichungen ist es notwendig, die Ursache der Abweichung zu ermitteln und das Risiko angemessen zu kontrollieren. Insbesondere mit der Entwicklung von Unternehmen gibt es viele Datenquellen und unterschiedliche Qualit\u00e4tsstufen, was sich unweigerlich auf die Datenergebnisse auswirkt. Daher ist die M\u00f6glichkeit der Datenr\u00fcckverfolgbarkeit sehr wertvoll.<\/li>\n<li>Auswirkungsanalyse: Mit zunehmender Anzahl von Datenanwendungen wird die Datenflusskette immer l\u00e4nger. Bei \u00c4nderungen im Kerngesch\u00e4ft einer Quelle m\u00fcssen nachgelagerte Analyseanwendungen synchronisiert werden. Ohne Auswirkungsanalyse kommt es zu anormalen Zugriffen auf jeden Datendienst. Dies ist oft eine Kernanforderung des Entwicklungssektors, um Auswirkungsbewertungen zu erm\u00f6glichen.<\/li>\n<li>Der Datenwert: Die Messung des Datenwerts ist ein komplexes Problem. Um den Wert von Daten zu bewerten, ben\u00f6tigt man eine Grundlage. Die Datenherkunft liefert Referenzdaten in verschiedenen Aspekten, um die Bewertung zu erleichtern. <strong>Datenzielgruppe<\/strong>: Je mehr Datennachfrager, desto gr\u00f6\u00dfer der Datenwert.<br \/>\n<strong>Aktualisierungsumfang<\/strong>: Je gr\u00f6\u00dfer die Menge der aktualisierten Daten, desto h\u00f6her ist der Wert der Daten.<br \/>\n<strong>Aktualisierungsh\u00e4ufigkeit<\/strong>: Je h\u00e4ufiger die Aktualisierung, desto wertvoller sind die Daten.<\/li>\n<li>Qualit\u00e4tsbewertung: Dies ist die Anforderung von <a href=\"https:\/\/www.gudusoft.com\/de\/how-to-choose-a-data-analysis-tool\/\"><strong>Datenanalyse<\/strong><\/a> Anwendungen, und es ist notwendig, die Qualit\u00e4t der Endergebnisdaten zu kontrollieren. Wenn Datenprobleme gefunden werden, ist es notwendig, die Datenquelle weiter zu verfolgen, die Ursachen der Qualit\u00e4tsprobleme zu analysieren und diese anschlie\u00dfend zu beheben. Aus dem Datenherkunftsdiagramm l\u00e4sst sich der Datenverarbeitungsprozess leicht ableiten und anschlie\u00dfend die m\u00f6glichen Qualit\u00e4tsprobleme analysieren.<\/li>\n<li>Der Lebenszyklus: Durch die Datenherkunft l\u00e4sst sich der gesamte Lebenszyklus der Daten intuitiv erfassen. Bei weniger wertvollen Daten kann eine Tiering-, Archivierungs- oder sogar Vernichtungsverfahren in Betracht gezogen werden.<\/li>\n<li>Compliance-Anforderungen: Dies ist oft die Anforderung des oberen Managements. F\u00fcr die Einhaltung gesetzlicher Vorschriften sind alle Punkte und Quellen des Datenflusses die wichtigsten Punkte, die reguliert werden m\u00fcssen. Daher ist ein umfassendes Verst\u00e4ndnis der Beziehungen zwischen Daten erforderlich.<\/li>\n<li>Sicherheitskontrolle: Dies ist oft eine Sicherheitsanforderung, um zu verstehen, wie die Daten verwendet werden und wer die Zielgruppe ist. All dies ist aus der Datenherkunft ersichtlich. Sie bilden auch die Grundlage f\u00fcr das Berechtigungsmanagement (Autorisierung auf Tabellen- und Feldebene) und gew\u00e4hrleisten so die Datensicherheit auf h\u00f6herer Ebene. In Kombination mit den Sicherheitskennungen in den Metadaten (z. B. welche Daten desensibilisiert werden m\u00fcssen usw.) k\u00f6nnen das Sicherheitsmanagement und die Sicherheitskontrolle der gesamten Dom\u00e4ne durchgef\u00fchrt werden.<\/li>\n<li>Architekturdesign: Data Lineage erm\u00f6glicht es, Daten aus der Perspektive der Datenverarbeitung zu verstehen. In manchen Szenarien ist dies durchaus sinnvoll. Wenn beispielsweise ein bestimmtes altes Projekt beendet wird und ein neues Projekt die Nachfolge antreten muss, ist die Organisation ohne eine Datenfluss-Mapping-Tabelle sehr zeitaufw\u00e4ndig und es ist schwierig, die Integrit\u00e4t und Korrektheit der Migration sicherzustellen.<\/li>\n<li>Datenbest\u00e4nde: Die Unternehmensleitung kann den gesamten Datenfluss anhand der Datenherkunft nachvollziehen. Dies ist f\u00fcr die Formulierung der Datenbestandsstrategie des Unternehmens von gro\u00dfem Nutzen.<\/li>\n<li>F&amp;E-Anforderungen: F\u00fcr das F&amp;E-Personal ist es bei Vorhandensein einer Datenherkunft praktisch, die Datenverarbeitungslogik zu finden und zu verstehen sowie Probleme zu beheben.<\/li>\n<\/ol>\n<p><strong> Alles, was Sie \u00fcber Data Lineage wissen m\u00fcssen \u2013 Die Methoden der Data Lineage-Erfassung<\/strong><\/p>\n<ol>\n<li>Automatisches Parsen: Automatisches Parsen ist derzeit die g\u00e4ngigste Erfassungsmethode. Die spezifische Methode besteht darin, SQL-Anweisungen, gespeicherte Prozeduren, ETL-Prozeduren und andere Dateien zu analysieren. Aufgrund der Komplexit\u00e4t des Codes und der Anwendungsumgebung sowie aus anderen Gr\u00fcnden kann die automatische Analyse nach Erfahrungen internationaler Hersteller 70\u2013951 TP2T Unternehmensdaten abdecken, 1001 TP2T sind derzeit jedoch nicht erreichbar.<\/li>\n<li>Systemverfolgung: Das hei\u00dft, w\u00e4hrend des Datenverarbeitungsflusses ist das Datenverarbeitungsprogramm f\u00fcr die \u00dcbermittlung von Datenherkunftsinformationen verantwortlich. F\u00fcgen Sie beispielsweise im Anmerkungsbereich eine Beschreibung der Herkunft usw. hinzu. Der Vorteil dieses Ansatzes besteht darin, dass die Erfassung pr\u00e4zise, zeitnah und detailliert unterst\u00fctzt wird. Der Nachteil ist jedoch, dass er aufdringlich ist. Wenn das Unternehmen jedoch eine einheitliche Verarbeitungsplattform einsetzt, ist diese Methode dringend zu empfehlen.<\/li>\n<li>Maschinelles Lernen: Diese Methode berechnet die \u00c4hnlichkeit von Daten basierend auf den Abh\u00e4ngigkeiten zwischen Datens\u00e4tzen. Der Vorteil dieser Methode besteht darin, dass keine Abh\u00e4ngigkeit von Tools und Unternehmen besteht. Der Nachteil besteht darin, dass die Genauigkeitsrate manuell best\u00e4tigt werden muss.<\/li>\n<li>Manuelle Erfassung: Die letzte Methode ist die \u201euniverselle\u201c Methode, bei der die Datenherkunft manuell von der Forschungs- und Entwicklungsabteilung organisiert wird.<\/li>\n<\/ol>\n<p><strong>Alles, was Sie \u00fcber Data Lineage wissen m\u00fcssen \u2013 Die Anwendung von Data Lineage<\/strong><\/p>\n<p>Basierend auf der M\u00f6glichkeit der Datenherkunft werden h\u00e4ufig die folgenden Anwendungen verwendet:<\/p>\n<ol>\n<li>Durch Angabe einer Tabelle\/eines Felds k\u00f6nnen Sie dessen Vorw\u00e4rts-Mehrebenenobjekt verfolgen.<\/li>\n<li>Durch Angabe der Tabelle\/des Feldes wird dessen r\u00fcckw\u00e4rtiges mehrstufiges Objekt zugeordnet.<\/li>\n<li>Sie sind nicht auf ein einzelnes Objekt beschr\u00e4nkt, sondern k\u00f6nnen den gesamten Datenfluss in gr\u00f6\u00dferem Ma\u00dfstab (z. B. innerhalb eines Projekts usw.) verstehen. Dies ist sinnvoll f\u00fcr die Analyse von Hot Objects, die Datenbereinigung usw.<\/li>\n<li>Das hei\u00dft, ausgehend von der Perspektive des \u201eBetriebs\u201c werden die Vorw\u00e4rts- und R\u00fcckw\u00e4rtsvorg\u00e4nge analysiert. Dies ist f\u00fcr die Fehlerbehebung, Qualit\u00e4tsanalyse und mehr sinnvoll.<\/li>\n<li>Neben unserem \u00fcblichen Verst\u00e4ndnis von Herkunft gibt es eine allgemeinere Herkunft. Es gibt nicht nur eine Beziehung auf Datenebene zwischen Objekten, sondern auch eine Beziehung auf Referenzebene, d. h. die damit verbundene Verwendung zwischen Objekten, einschlie\u00dflich, aber nicht beschr\u00e4nkt auf Tabellen, Ansichten, Modelle, Berichte, Jobs usw. Dies ist f\u00fcr die Bewertung des Datenwerts, das Datenbestandsmanagement usw. von Bedeutung.<\/li>\n<li>Bei der herk\u00f6mmlichen Datenexploration wird diese h\u00e4ufig entsprechend der Datenhierarchiedefinition durchgef\u00fchrt. Wenn eine Datenherkunft vorliegt, wird eine andere Explorationsmethode bereitgestellt, n\u00e4mlich eine schrittweise Exploration entsprechend der Datenverarbeitungslogik.<\/li>\n<\/ol>\n<h3>Abschluss<\/h3>\n<p>Vielen Dank f\u00fcr das Lesen unseres Artikels. Wir hoffen, er ist hilfreich f\u00fcr Sie. Wenn Sie mehr \u00fcber die Datenherkunft erfahren m\u00f6chten, empfehlen wir Ihnen, Folgendes zu besuchen: <a href=\"https:\/\/sqlflow.gudusoft.com\/#\/\" rel=\"dofollow\"><strong>Gudu SQLFlow<\/strong><\/a> f\u00fcr weitere Informationen.<\/p>\n<p>Als einer der <a href=\"https:\/\/www.dpriver.com\/blog\/2022\/05\/11\/best-data-lineage-tools\/\" rel=\"dofollow\"><strong>die besten Datenherkunftstools<\/strong><\/a> Gudu SQLFlow ist heute auf dem Markt erh\u00e4ltlich und kann nicht nur SQL-Skriptdateien analysieren, die Datenherkunft ermitteln und eine visuelle Anzeige durchf\u00fchren, sondern erm\u00f6glicht Benutzern auch, die Datenherkunft im CSV-Format bereitzustellen und eine visuelle Anzeige durchzuf\u00fchren. (<strong>Ver\u00f6ffentlicht von Ryan am 29. August 2022<\/strong>)<\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":5713,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[178,179],"tags":[55,379,376,378,377,375],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/posts\/5700"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/comments?post=5700"}],"version-history":[{"count":14,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/posts\/5700\/revisions"}],"predecessor-version":[{"id":5733,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/posts\/5700\/revisions\/5733"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/media\/5713"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/media?parent=5700"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/categories?post=5700"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/tags?post=5700"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}