{"id":5146,"date":"2022-07-16T01:43:52","date_gmt":"2022-07-16T09:43:52","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=5146"},"modified":"2022-09-17T14:20:34","modified_gmt":"2022-09-17T22:20:34","slug":"best-open-source-data-governance-tools","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/de\/beste-open-source-tools-zur-datenverwaltung\/","title":{"rendered":"Die 7 besten Open-Source-Data-Governance-Tools, die Sie 2022 in Betracht ziehen sollten"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>Die 7 besten Open-Source-Tools zur Datenverwaltung im Jahr 2022<\/h2>\n<p>Eine gute Open Source finden <a href=\"https:\/\/www.gudusoft.com\/de\/best-data-governance-tools-software\/\"><strong>Daten-Governance-Tool<\/strong><\/a> kann aus vielen Gr\u00fcnden eine Herausforderung sein. In erster Linie ist die gr\u00f6\u00dfte H\u00fcrde bei der Entscheidung \u00fcber alles, was mit <strong><a href=\"https:\/\/www.gudusoft.com\/de\/was-ist-daten-governance\/\">Datenverwaltung<\/a><\/strong> Das Fehlen eines standardisierten Ansatzes \u2013 die Ziele sind nicht klar definiert. Dar\u00fcber hinaus sind die Data-Governance-Funktionen der meisten Open-Source-Tools unklar. Sie m\u00fcssen die Dokumentationsseiten und das GitHub-Repository durchforsten, um festzustellen, ob ein bestimmtes Tool f\u00fcr einen bestimmten Anwendungsfall geeignet ist.<\/p>\n<p>Dar\u00fcber hinaus sind die Data-Governance-Funktionen der meisten Open-Source-Tools unklar. Daher m\u00fcssen Sie die Dokumentationsseiten und GitHub-Repositories durchforsten, um festzustellen, ob ein bestimmtes Tool f\u00fcr einen bestimmten Anwendungsfall geeignet ist. Um Ihnen die Auswahl zu erleichtern, haben wir eine Liste der besten Open-Source-Data-Governance-Tools des Jahres 2022 zusammengestellt.<\/p>\n<div id=\"attachment_5150\" style=\"width: 842px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-5150\" decoding=\"async\" class=\"size-full wp-image-5150\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools.png\" alt=\"Die besten Open Source-Tools zur Datenverwaltung\" width=\"832\" height=\"498\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools-200x120.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools-300x180.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools-400x239.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools-600x359.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools-768x460.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools-800x479.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools.png 832w\" sizes=\"(max-width: 832px) 100vw, 832px\" \/><p id=\"caption-attachment-5150\" class=\"wp-caption-text\">Die besten Open Source-Tools zur Datenverwaltung<\/p><\/div>\n<h3>Beste Open Source Data Governance Tools \u2013 1. Amundsen<\/h3>\n<p>Amundsen wurde urspr\u00fcnglich bei Lyft entwickelt und wird derzeit von der LF AI &amp; Data Foundation gehostet und gepflegt. Im Bereich Data Governance befasst es sich haupts\u00e4chlich mit Datensicherheit und der Einhaltung von Datenschutz- und Souver\u00e4nit\u00e4tsgesetzen. Die Idee besteht darin, alle Daten auf Metadatenebene zu kennzeichnen und zu kategorisieren.<\/p>\n<p>Mit Amundsen k\u00f6nnen Sie nach Metadaten suchen und herausfinden, wer die Daten wie oft nutzt. Sie k\u00f6nnen sich einen Eindruck von den Daten verschaffen, indem Sie sich die Datenzugriffsmuster ansehen. Dieser Ansatz ist jedoch eher reaktiv. F\u00fcr einen proaktiveren Ansatz ben\u00f6tigen Sie feingranulare Zugriffskontrollen, um den Zugriff auf Daten basierend auf Team-, Rollen-, Einzel-, System- usw. Datenzugriffsrichtlinien zu verhindern.<\/p>\n<p>Obwohl Sie in Amundsen noch nicht \u00fcber RBAC (rollenbasierte Zugriffskontrolle) verf\u00fcgen, verf\u00fcgen Sie dennoch \u00fcber einige wichtige Datenverwaltungsfunktionen, wie z. B. das Markieren und Kategorisieren von Metadaten.<\/p>\n<p>Aufgrund der eingeschr\u00e4nkten Data-Governance-Funktionen des standardm\u00e4\u00dfigen Neo4J-Backends entschied sich Amundsen, Unterst\u00fctzung f\u00fcr Apache Atlas hinzuzuf\u00fcgen. Da Apache Atlas einer der ausgereiftesten <a href=\"https:\/\/www.gudusoft.com\/de\/was-ist-metadatenverwaltung\/\"><strong>Metadatenverwaltung<\/strong><\/a> Plattformen, viele Funktionen wurden in verschiedenen Systemen erprobt und getestet und sorgen f\u00fcr Zuverl\u00e4ssigkeit bei Datenkatalogisierungs- und Governance-L\u00f6sungen. Amundsen bietet gute Unterst\u00fctzung f\u00fcr <strong><a href=\"https:\/\/www.gudusoft.com\/de\/whats-data-lineage-why-important\/\">Datenherkunft<\/a><\/strong> und Label-\/Badge-Verbreitung (mithilfe der Herkunft).<\/p>\n<p>Neo4j- oder Atlas-Backends eignen sich grunds\u00e4tzlich f\u00fcr die meisten Unternehmen. Manche Unternehmen w\u00fcnschen sich jedoch erweiterte Funktionen f\u00fcr ihre Datenkatalogisierungs- und Governance-L\u00f6sungen.<\/p>\n<h3>Beste Open-Source-Data-Governance-Tools \u2013 2. DataHub<\/h3>\n<p>LinkedIn entwickelte DataHub, nachdem WhereHows die wachsende Nachfrage nach Tools zur Metadatensuche und -ermittlung nicht mehr befriedigen konnte. Vor DataHub nutzte LinkedIn bereits andere Tools in Verbindung mit WhereHows, um Datenverwaltungsfunktionen hinzuzuf\u00fcgen.<\/p>\n<p>DataHub erm\u00f6glicht Ihnen eine feingranulare Zugriffskontrolle auf Metadaten. Der Zugriff wird durch Richtlinien gesteuert, die Sie \u00fcber die Web-Benutzeroberfl\u00e4che und die GraphQL-API deklarieren k\u00f6nnen. Die DataHub-Strategie greift auf zwei Ebenen: Plattform und Metadaten. \u00dcber Plattformrichtlinien k\u00f6nnen Sie Benutzerberechtigungen f\u00fcr DataHub steuern, beispielsweise welche Funktionen und in welchem Umfang Benutzer diese anzeigen und nutzen k\u00f6nnen.<\/p>\n<p>Sie k\u00f6nnen diese Richtlinien auf einzelne Benutzer oder Gruppen anwenden. Metadatenrichtlinien hingegen erm\u00f6glichen es Ihnen, zu steuern, welche Benutzer Zugriff auf verschiedene Metadatenentit\u00e4ten, Diagramme, Datenquellen, Dashboards usw. haben und welche Aktionen sie darauf ausf\u00fchren k\u00f6nnen. DataHub erm\u00f6glicht Ihnen derzeit jedoch nicht, Leseberechtigungen zu steuern.<\/p>\n<p>Mehrere weitere Funktionen sind Teil der DataHub-Roadmap, es gibt jedoch noch keinen klar definierten Zeitplan. Eine der wichtigsten Data-Governance-Funktionen ist RBAC, die rollenbasierte Zugriffskontrolle f\u00fcr Entit\u00e4ten und Aspekte (PDL-Datens\u00e4tze). RBAC bietet nicht nur eine feinere Zugriffskontrolle f\u00fcr Metadaten, sondern unterst\u00fctzt auch ein besseres Label-Management, die Zugriffskontrolle f\u00fcr die Datenvorschau und vieles mehr.<\/p>\n<p>In Bezug auf Governance\/Datenschutz: DataHub unterst\u00fctzt die Klassifizierung auf Datensatzebene, die kontrollierte Datenbewegung, die automatische Datenl\u00f6schung, den Datenexport und vieles mehr. Im Rahmen der Roadmap ist geplant, einige Compliance-Funktionen als Open Source bereitzustellen.<\/p>\n<h3>Beste Open-Source-Tools f\u00fcr Data Governance \u2013 3. Apache Atlas<\/h3>\n<p>Als einer der ersten Open-Source-Datenkataloge mit integrierten Data-Governance-Funktionen hatte das Apache Atlas-Projekt einen eher langsamen Entwicklungszyklus, ganz zu schweigen davon, dass das Projekt speziell f\u00fcr das Hadoop-\u00d6kosystem entwickelt wurde. Es funktioniert mit allen in Hive integrierten Systemen.<\/p>\n<p>Apache Atlas eignet sich besonders gut f\u00fcr die Klassifizierung und erm\u00f6glicht die Erstellung von Kategorien f\u00fcr Datensensitivit\u00e4t, Ablaufdatum und Qualit\u00e4t im Handumdrehen. Damit kommen wir zur Datenherkunft, einer weiteren beliebten Funktion von Apache Atlas. Atlas implementiert echte Datenherkunft, d. h. die Herkunft ist operativ.<\/p>\n<p>Durch die Verwendung von Herkunftsdaten kann Apache Atlas Metadateneigenschaften an Entit\u00e4ten in einer Herkunftshierarchie weitergeben, eine Funktion, die Sie in anderen Datenverwaltungstools nicht finden.<\/p>\n<p>Apache Atlas bietet au\u00dferdem zahlreiche DE-Datenschutz- und Sicherheitsfunktionen. Beispielsweise bietet es eine feingranulare Zugriffskontrolle f\u00fcr Entit\u00e4ten und Kategorien und arbeitet optimal mit Apache Ranger zur Datenautorisierung und -maskierung zusammen. Im Zusammenspiel bilden diese Funktionen ein effektives Datenschutz- und Sicherheitsnetzwerk, das den Schutz oder die Klassifizierung von Daten als PII, sensibel usw. erm\u00f6glicht. Insbesondere bietet es Ihnen auch einen Rahmen zur Kontrolle des Zugriffs auf PII und sensible Daten.<\/p>\n<h3>Beste Open Source Data Governance Tools \u2013 4. Magda<\/h3>\n<p>MAGDA wurde von Data61, dem Data-Science-Zweig der CSIRO (Commonwealth Scientific and Industrial Research Organisation of Australia), entwickelt und steht f\u00fcr \u201eMaking Australian Government Data Available\u201c. Die CSIRO setzte Magda ein, um ein Open-Data-Portal mit \u00fcber 70.000 Datens\u00e4tzen der australischen Bundes- und Landesregierungen zu erstellen und stellte das Projekt als Open Source f\u00fcr andere zur Verf\u00fcgung.<\/p>\n<p>Obwohl Magdas umfangreichste und ausgereifteste Funktion weiterhin die Suche und Entdeckung ist, bietet es auch leistungsstarke Unterst\u00fctzung f\u00fcr das Taggen und Definieren von Datensatzthemen. Dar\u00fcber hinaus verf\u00fcgt Magda \u00fcber integrierte Datenvorschau-Optionen, darunter Tabellenkalkulationen und interaktive Diagramme. Andere Tools wie Amundsen m\u00fcssen in Superset integriert werden. Ein Vorbehalt: Die Integration mit Tools wie Superset f\u00fcr die Datenvorschau ist skalierbarer.<\/p>\n<p>While Magda does not currently support RBAC (role-based access control), it does support features that allow strict control of access to resources ingested into Magda. Magda uses Kubernetes to remain cloud-independent. It uses the open policy broker standard to manage access policies, which facilitates different types of access control, such as role-based, attribute-based, and so on.<\/p>\n<h3>Beste Open Source Data Governance Tools \u2013 5. Offene Metadaten<\/h3>\n<p>Angek\u00fcndigt im August 2021, <strong>Offene Metadaten<\/strong> definiert Spezifikationen zur Standardisierung von Metadaten mithilfe eines Schema-First-Ansatzes, der aus einem zentralen Metadatenspeicher und einem Aufnahmeframework besteht, das g\u00e4ngige Konnektoren im Datenstapel unterst\u00fctzt.<\/p>\n<p>Open Metadata verfolgt einen anderen Tagging-Ansatz. Er erm\u00f6glicht die Kennzeichnung von Dateneigent\u00fcmern mit Datens\u00e4tzen und die Kennzeichnung von Datens\u00e4tzen in mehreren Ebenen basierend auf ihrer Wichtigkeit. Open Metadata implementiert zudem die gesamte Metadaten-Versionskontrolle. Das bedeutet, dass neben den Datenbankentit\u00e4ten (Tabellen, Ansichten, Modus), dem Tag, den Eigent\u00fcmern des Datensatzes, detaillierten Informationen und dem zugeh\u00f6rigen Fachvokabular alle Metadaten f\u00fcr die Versionskontrolle sowie alle Informationen zu \u00c4nderungen, z. B. wer die \u00c4nderung vorgenommen hat und wann, gespeichert werden.<\/p>\n<h3>Beste Open Source Data Governance Tools \u2013 6.Egeria<\/h3>\n<p>Egeria wurde 2019 eingef\u00fchrt und wird von der Abteilung f\u00fcr KI und Daten der Linux Foundation betreut. Es erm\u00f6glicht den einfachen und herstellerneutralen Austausch von Metadaten zwischen Tools und Plattformen. Andere Tools nutzen hierf\u00fcr SDKs und APIs, deren M\u00f6glichkeiten jedoch begrenzt sind. Egeria hingegen leistet gute Arbeit, da es auf den Prinzipien der Plattformunabh\u00e4ngigkeit, der einfachen Erweiterbarkeit und der Datenzug\u00e4nglichkeit basiert.<\/p>\n<p>W\u00e4hrend alle anderen Tools, die wir bisher gesehen haben, Probleme der Metadatenverwaltung und -verwaltung in erster Linie aus der Benutzerperspektive angehen, versucht Egeria, Probleme f\u00fcr Benutzer und Systeme zu l\u00f6sen und funktioniert gut mit einer Vielzahl von Datentools.<\/p>\n<p>Egeria bietet Ihnen eine sehr detaillierte und feingranulare Kontrolle \u00fcber Ihre Metadaten durch Governance-Regionen, G\u00fcltigkeitsdaten, Metadatenarchivierung, Metadatenherkunft und vieles mehr, von denen einige nur bei Egeria verf\u00fcgbar sind. Erw\u00e4hnenswert ist auch, dass es \u00fcber 800 vordefinierte Funktionen bietet, die jedoch nicht darauf beschr\u00e4nkt sind. <strong><a href=\"https:\/\/www.gudusoft.com\/de\/arten-von-metadaten\/\">Metadatentypen<\/a><\/strong>Sie k\u00f6nnen auch Ihre eigenen Typen basierend auf Ihren Gesch\u00e4ftsanforderungen definieren. Dies bedeutet, dass Egeria flexibel genug ist, um sich an Ihre Gesch\u00e4ftsanforderungen anzupassen.<\/p>\n<h3>Beste Open Source Data Governance Tools \u2013 7. Truedat<\/h3>\n<p>Schlie\u00dflich TrueDat, wohl das einzige ausgereifte <strong>Open-Source-Tool zur Datenverwaltung<\/strong> auf der Liste, wurde von BlueTab (jetzt IBM) erstellt, nachdem das Unternehmen als Anbieter von Datenl\u00f6sungen die Marktbed\u00fcrfnisse erkannt und L\u00fccken im Bereich der Datenverwaltung festgestellt hatte.<\/p>\n<p>TrueDat verf\u00fcgt \u00fcber eine Reihe von Funktionen, die sich mit den anderen oben genannten Tools \u00fcberschneiden, darunter <strong><a href=\"https:\/\/www.gudusoft.com\/de\/was-ist-der-datenkatalog-warum-sind-die-daten-datenprotokoll\/\">Datenkataloge<\/a><\/strong>, Suchmaschinen, Datenherkunftsfunktionen und so weiter. Die beliebtesten Funktionen sind jedoch die <strong><a href=\"https:\/\/www.gudusoft.com\/de\/what-is-a-data-glossary\/\">Gesch\u00e4ftsvokabular<\/a><\/strong> und die M\u00f6glichkeit, Daten team\u00fcbergreifend zu teilen, mit feink\u00f6rnigen Kontrollen, die sich auf Datenverwaltung und Dateneigentumsverwaltung, Klassifizierung usw. konzentrieren.<\/p>\n<p>Weitere Funktionen machen TrueDat in dieser Liste einzigartig. Eine davon ist die Datenfreigabefunktion \u00e4hnlich der von Snowflake, die Teams den Austausch und die effektivere Zusammenarbeit erleichtert. Um ein hohes Ma\u00df an Sicherheit und Kontrolle \u00fcber die Daten zu gew\u00e4hrleisten, k\u00f6nnen Abonnement- und Benachrichtigungsfunktionen genutzt werden, um \u00c4nderungsereignisse in Pr\u00fcfprotokollen aufzuzeichnen und in Echtzeit zu \u00fcberwachen.<\/p>\n<h3>Abschluss<\/h3>\n<p>Vielen Dank f\u00fcr das Lesen unseres Artikels. Wir hoffen, er ist hilfreich f\u00fcr Sie bei der Suche nach den besten Open-Source-Data-Governance-Tools. F\u00fcr weitere Informationen zu Open-Source-Data-Governance-Tools empfehlen wir Ihnen die Nutzung von <a href=\"https:\/\/www.gudusoft.com\/de\/\"><strong>Gudu SQLFlow<\/strong><\/a> f\u00fcr weitere Informationen.<\/p>\n<p>Als einer der\u00a0<strong><a href=\"https:\/\/www.dpriver.com\/blog\/2022\/05\/11\/best-data-lineage-tools\/\" target=\"_blank\" rel=\"noopener noreferrer\">die besten Datenherkunftstools<\/a><\/strong>\u00a0Gudu SQLFlow ist heute auf dem Markt erh\u00e4ltlich und kann nicht nur SQL-Skriptdateien analysieren, Datenherkunft ermitteln und visuelle Anzeigen durchf\u00fchren, sondern erm\u00f6glicht es Benutzern auch,\u00a0<strong>Datenherkunft<\/strong>\u00a0im CSV-Format und f\u00fchren Sie eine visuelle Anzeige durch.\u00a0<strong>(Ver\u00f6ffentlicht von Ryan am 16. Juli 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":5164,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[178],"tags":[299,294,298,268,300,288,75,301,302,291],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/posts\/5146"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/comments?post=5146"}],"version-history":[{"count":17,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/posts\/5146\/revisions"}],"predecessor-version":[{"id":5165,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/posts\/5146\/revisions\/5165"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/media\/5164"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/media?parent=5146"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/categories?post=5146"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/tags?post=5146"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}