{"id":5124,"date":"2022-07-15T20:26:50","date_gmt":"2022-07-16T04:26:50","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=5124"},"modified":"2022-07-15T20:26:50","modified_gmt":"2022-07-16T04:26:50","slug":"best-open-source-data-catalog-tools","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/de\/beste-open-source-datenkatalog-tools\/","title":{"rendered":"Die 4 besten Open-Source-Datenkatalog-Tools, die Sie 2022 in Betracht ziehen sollten"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>Die 4 besten Open-Source-Datenkatalog-Tools im Jahr 2022<\/h2>\n<p>Grunds\u00e4tzlich braucht jede datengesteuerte Organisation <a href=\"https:\/\/www.gudusoft.com\/de\/beste-datenkatalog-tools\/\"><strong>Datenkatalog-Tools<\/strong><\/a>. <strong><a href=\"https:\/\/www.gudusoft.com\/de\/was-ist-der-datenkatalog-warum-sind-die-daten-datenprotokoll\/\">Datenkataloge<\/a><\/strong> Helfen Sie dabei, eine zentrale Umgebung zu schaffen, in der alle Daten und der Kontext einer Organisation abgerufen werden k\u00f6nnen. So k\u00f6nnen Unternehmen ihre Analysezeit verk\u00fcrzen und schnell hochwertige, datenbasierte Gesch\u00e4ftsentscheidungen treffen. Wenn Sie auf der Suche nach <strong>die besten Open-Source-Datenkatalog-Tools<\/strong>, dann sind Sie hier genau richtig. In diesem Beitrag haben wir eine Liste der <strong>Die besten Open-Source-Datenkatalog-Tools im Jahr 2022<\/strong> um Ihnen das Leben zu erleichtern.<\/p>\n<div id=\"attachment_5129\" style=\"width: 828px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-5129\" decoding=\"async\" class=\"size-full wp-image-5129\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools.png\" alt=\"Die besten Open-Source-Datenkatalog-Tools\" width=\"818\" height=\"471\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-200x115.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-300x173.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-400x230.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-600x345.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-768x442.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-800x461.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools.png 818w\" sizes=\"(max-width: 818px) 100vw, 818px\" \/><p id=\"caption-attachment-5129\" class=\"wp-caption-text\">Die besten Open-Source-Datenkatalog-Tools<\/p><\/div>\n<h3>Beste Open-Source-Datenkatalog-Tools \u2013 1. Apache Atlas<\/h3>\n<p>Als Open Source <strong><a href=\"https:\/\/www.gudusoft.com\/de\/was-ist-metadatenverwaltung\/\">Metadatenverwaltung<\/a><\/strong> Das Tool und die Governance-Plattform Apache Atlas werden von Hortonworks unter dem Dach der Data Governance Initiative inkubiert.<\/p>\n<p>Es wurde 2015 dem Apache Foundation Incubator beigetreten und entwickelte sich 2017 zu einem Top-Programm. Apache Atlas gilt allgemein als einer der Bausteine moderner Datenplattformen, da es schon fr\u00fch die Vision verfolgte, mithilfe von Metadaten die Herausforderungen der Datenkatalogisierung, -sortierung, -ermittlung, -verwaltung und -zusammenarbeit zu l\u00f6sen.<\/p>\n<p>Hauptfunktionen von Apache Atlas:<\/p>\n<ol>\n<li><strong>Metadatenklassifizierung:<\/strong> Mit Apache Atlas k\u00f6nnen Sie personenbezogene Daten, sensible Daten und andere sensible Daten automatisch klassifizieren. Datenbest\u00e4nde k\u00f6nnen mehreren Klassifizierungen zugeordnet werden. Diese Richtlinien werden auch \u00fcber die Herkunft weitergegeben, um sicherzustellen, dass abgeleitete Daten dieselben Klassifizierungs- und Sicherheitskontrollen erhalten.<\/li>\n<li><strong>Metadatentypen und -instanzen:<\/strong> Laut der Apache-Dokumentation ist ein \u201eTyp\u201c eine Definition, wie ein bestimmter Typ von Metadatenobjekt in Atlas gespeichert und abgerufen wird. Dies erm\u00f6glicht <a href=\"https:\/\/www.gudusoft.com\/de\/datenverwalter\/\"><strong>Datenverwalter<\/strong><\/a> um technische und gesch\u00e4ftliche Metadaten zu definieren.<\/li>\n<li><strong>Suche und Herkunft:<\/strong> Die intuitive Benutzeroberfl\u00e4che von Apache Atlas erm\u00f6glicht die vordefinierte und tempor\u00e4re Untersuchung von Datentypen nach Typ, Kategorie, Attributwert oder Freitext. Dar\u00fcber hinaus wird der Verlauf der Datenquelle bzw. der expliziten Daten und ihrer Entwicklung im Laufe der Zeit gespeichert.<\/li>\n<li><strong>Sicherheit und Datenmaskierung:<\/strong> Apache Atlas ist in erster Linie ein Datenverwaltungstool, das eine feink\u00f6rnige Sicherheit des Metadatenzugriffs erm\u00f6glicht, um die Zugriffskontrolle \u00fcber Entit\u00e4tsinstanzen einzurichten sowie Klassifizierungen hinzuzuf\u00fcgen\/aktualisieren\/entfernen usw.<\/li>\n<\/ol>\n<h3>Beste Open-Source-Datenkatalog-Tools \u2013 2. Amundsen Lyft<\/h3>\n<p>Amundsen ist eine Open-Source-Datenkatalogplattform, die urspr\u00fcnglich vom Entwicklungsteam von Lyft entwickelt wurde. Im Oktober 2019, ein Jahr nach der Einf\u00fchrung f\u00fcr den internen Gebrauch, wurde der Quellcode freigegeben.<\/p>\n<p>Amundsen verf\u00fcgt \u00fcber eine geschlossene Community aus Mitwirkenden und Benutzern und wird von vielen anderen Organisationen \u00fcbernommen, die auf diesem Open-Source-Datenkatalog-Tool aufbauen, um ihre Initiativen zur Demokratisierung, Verwaltung und Metadatendienstleistung von Daten voranzutreiben.<\/p>\n<p><strong>Hauptf\u00e4higkeiten von Amundsen:<\/strong><\/p>\n<ol>\n<li><strong>Vertrauensw\u00fcrdige Daten leicht finden:<\/strong> Amundsen hilft dabei, Daten aus einer Vielzahl von Quellen mit einfachen Textsuchen zu finden, und die Suchergebnisse zeigen sogar Online-Metadaten an.<\/li>\n<li><strong>Automatisierte und kuratierte Metadaten:<\/strong> Wenn auf ein Datenobjekt geklickt wird, werden dem Benutzer dessen detaillierte Beschreibung und Verhalten angezeigt, die manuell kuratiert bzw. automatisch generiert werden.<\/li>\n<li><strong>M\u00f6glichkeit, Kontext mit Kollegen zu teilen:<\/strong> Beschreibungen von Datenbest\u00e4nden k\u00f6nnen aktualisiert werden, sodass Kollegen nicht mehr st\u00e4ndig hin- und herbl\u00e4ttern m\u00fcssen, um mehr Kontext f\u00fcr einen bestimmten Datenbestand zu finden.<\/li>\n<li><strong>Aus der Datennutzung lernen und verstehen:<\/strong> Benutzer k\u00f6nnen sehen, welche Datenbest\u00e4nde h\u00e4ufig verwendet werden, sich in ihrem Besitz befinden oder mit Lesezeichen versehen sind. Sie k\u00f6nnen sogar die h\u00e4ufigsten Abfragen in Bezug auf Tabellen sehen, indem sie sich die Dashboards ansehen, die f\u00fcr eine bestimmte Tabelle erstellt wurden.<\/li>\n<\/ol>\n<h3>Beste Open-Source-Datenkatalog-Tools \u2013 3. LinkedIn DataHub<\/h3>\n<p>DataHub ist eine Open-Source-Plattform zur Metadatenverwaltung, die vom Entwicklungsteam von LinkedIn entwickelt wurde. Dabei handelt es sich um den zweiten Versuch von LinkedIn, die Herausforderungen der Datenkatalogisierung, -ermittlung, -beobachtung und -herkunft zu bew\u00e4ltigen.<\/p>\n<p>Vor DataHub entwickelten sie 2016 ein Open-Source-Datenverzeichnistool namens WhereHows. DataHub wurde 2019 angek\u00fcndigt und 2020 als Open Source ver\u00f6ffentlicht. Daher unterh\u00e4lt LinkedIn zwei verschiedene Versionen von DataHub \u2013 eine f\u00fcr den internen Gebrauch und eine Open Source f\u00fcr andere, die erstellt werden k\u00f6nnen.<\/p>\n<p><strong>Hauptfunktionen von DataHub:<\/strong><\/p>\n<ol>\n<li><strong>Automatisierte Metadatenaufnahme:<\/strong> Im LinkedIn DataHub werden Metadaten aus verschiedenen Quellen \u00fcber API oder Kafka-Stream-Push aufgenommen.<\/li>\n<li><strong>Einfache Datenermittlung:<\/strong> Auf der h\u00f6chsten Ebene f\u00fcr Endbenutzer unterst\u00fctzt das DataHub-Frontend drei Arten der Interaktion: Suchen, Durchsuchen und Anzeigen\/Bearbeiten von Metadaten.<\/li>\n<li><strong>Daten durch Kontext verstehen:<\/strong> Jede Datenentit\u00e4t auf DataHub verf\u00fcgt \u00fcber eine Profilseite, auf der alle mit dieser Datenentit\u00e4t verkn\u00fcpften Metadaten angezeigt werden und die dem Benutzer die Informationen liefert, die er zum Entwickeln dieses Datenkontexts ben\u00f6tigt.<\/li>\n<\/ol>\n<h3>Beste Open-Source-Datenkatalog-Tools \u2013 4. Netflix Metacat<\/h3>\n<p>Metacat ist ein gemeinsamer Metadatenverwaltungsdienst, der von Netflix entwickelt und im Juni 2018 als Open Source freigegeben wurde. Ziel ist es, das Sortieren, Auffinden, Verarbeiten und Verwalten von Daten zu vereinfachen.<\/p>\n<p>Metacat bietet in erster Linie einen zentralen Zugriff auf alle Datenbest\u00e4nde von Netflix. Obwohl Metacat ein Open-Source-Datenkatalog ist, scheint es an ausreichendem \u00f6ffentlichen Wissen zu mangeln, um das Schema effektiv nutzen und erweitern zu k\u00f6nnen.<\/p>\n<p><strong>Hauptfunktionen von Metacat:<\/strong><\/p>\n<ol>\n<li><strong>Datenabstraktion und Interoperabilit\u00e4t:<\/strong> Metacat bildet eine gemeinsame Abstraktionsschicht und auf Datens\u00e4tze kann \u00fcber die verschiedenen Abfrage-Engines von Netflix zugegriffen werden.<\/li>\n<li><strong>Gesch\u00e4fts- und BENUTZERDEFINIERTE Metadatenspeicher:<\/strong> Metacat hilft bei der Dokumentation von gesch\u00e4ftlichen und benutzerdefinierten Metadaten zu Datenbest\u00e4nden und stellt sicher, dass Datenbenutzer mehr Informationen zu Datenbest\u00e4nden sowie Standardregeln f\u00fcr den Umgang mit diesen erhalten.<\/li>\n<li><strong>Datenermittlung:<\/strong> Metacat stellt Schema-Metadaten und gesch\u00e4ftliche\/benutzerdefinierte Metadaten f\u00fcr Daten \u00fcber ElasticSearch bereit und erleichtert so die Abfrage \u00fcber die Textsuche.<\/li>\n<li><strong>Daten\u00e4nderungspr\u00fcfung und -benachrichtigung:<\/strong> Erfasst s\u00e4mtliche \u00c4nderungen oder Aktualisierungen der Metadaten und erm\u00f6glicht Push-Benachrichtigungen f\u00fcr solche Ereignisse, die m\u00f6glicherweise die Aufmerksamkeit des Benutzers erfordern.<\/li>\n<\/ol>\n<h3>Was sind die Vorteile von Open-Source-Datenkatalog-Tools?<\/h3>\n<p>Mithilfe hochwertiger Datenkataloge k\u00f6nnen Sie nicht nur alle Ihre Daten richtig kategorisieren, sondern auch Datenfl\u00fcsse zwischen unterschiedlichen Datentypen ordnungsgem\u00e4\u00df verfolgen und sogar Fehler in Datenfl\u00fcssen aufzeigen, die Sie verbessern k\u00f6nnen.<\/p>\n<p>Ein weiteres n\u00fctzliches Feature ist die Verwaltung sensibler Daten. Das Tool erkennt, wo sensible Daten am h\u00e4ufigsten angezeigt werden, wodurch das Risiko von Datenlecks reduziert wird. Einige hochwertige Datenkatalog-Tools bieten sogar maschinelles Lernen, um zu verstehen, wie Sie Ihre Daten verwalten, und Sie bei der Verarbeitung gro\u00dfer Datenmengen zu unterst\u00fctzen. Aber warum sollte man ein Open-Source-Datenverzeichnis-Tool verwenden?<\/p>\n<p>Open-Source-Datenkatalog-Tools sind immer noch hochwertige Software, kosteng\u00fcnstig, manchmal sogar kostenlos, aber sie sind gut skalierbar, bieten viele Anpassungsm\u00f6glichkeiten und k\u00f6nnen ohne Einschr\u00e4nkungen arbeiten, ideal f\u00fcr gro\u00dfe Datenmengen.<\/p>\n<p>Dar\u00fcber hinaus m\u00fcssen Sie sich als Unternehmen oder Organisation keine Sorgen dar\u00fcber machen, ob Sie sich bei Updates auf einen einzigen Entwickler verlassen m\u00fcssen, da Sie Entwickler beauftragen k\u00f6nnen, die Open-Source-Software weiterzuentwickeln oder sie einfach an Ihre Bed\u00fcrfnisse anzupassen.<\/p>\n<h3>Abschluss<\/h3>\n<p>Vielen Dank f\u00fcr das Lesen unseres Artikels und wir hoffen, dass er Ihnen dabei helfen kann, die <strong>die besten Open-Source-Datenkatalog-Tools<\/strong> im Jahr 2022. Wenn Sie weitere Informationen zu Open-Source-Datenkatalog-Tools w\u00fcnschen, empfehlen wir Ihnen den Besuch von <a href=\"https:\/\/www.gudusoft.com\/de\/\"><strong>Gudu SQLFlow<\/strong><\/a> f\u00fcr weitere Informationen.<\/p>\n<p>Als einer der\u00a0<strong><a href=\"https:\/\/www.dpriver.com\/blog\/2022\/05\/11\/best-data-lineage-tools\/\" target=\"_blank\" rel=\"noopener noreferrer\">die besten Datenherkunftstools<\/a><\/strong>\u00a0Gudu SQLFlow ist heute auf dem Markt erh\u00e4ltlich und kann nicht nur SQL-Skriptdateien analysieren,\u00a0<a href=\"https:\/\/www.gudusoft.com\/de\/whats-data-lineage-why-important\/\"><strong>Datenherkunft<\/strong><\/a>, und f\u00fchren Sie eine visuelle Anzeige durch, erm\u00f6glichen Sie Benutzern aber auch, die Datenherkunft im CSV-Format bereitzustellen und eine visuelle Anzeige durchzuf\u00fchren.\u00a0<strong>(Ver\u00f6ffentlicht von Ryan am 16. Juli 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":5141,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[178],"tags":[295,294,292,98,296,151,297,293],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/posts\/5124"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/comments?post=5124"}],"version-history":[{"count":18,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/posts\/5124\/revisions"}],"predecessor-version":[{"id":5144,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/posts\/5124\/revisions\/5144"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/media\/5141"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/media?parent=5124"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/categories?post=5124"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/de\/wp-json\/wp\/v2\/tags?post=5124"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}