{"id":5146,"date":"2022-07-16T01:43:52","date_gmt":"2022-07-16T09:43:52","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=5146"},"modified":"2022-09-17T14:20:34","modified_gmt":"2022-09-17T22:20:34","slug":"best-open-source-data-governance-tools","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/es\/las-mejores-herramientas-de-gobernanza-de-datos-de-codigo-abierto\/","title":{"rendered":"Las 7 mejores herramientas de gobernanza de datos de c\u00f3digo abierto para considerar en 2022"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>Las 7 mejores herramientas de gobernanza de datos de c\u00f3digo abierto de 2022<\/h2>\n<p>Encontrar un buen c\u00f3digo abierto <a href=\"https:\/\/www.gudusoft.com\/es\/el-mejor-software-de-herramientas-de-gobernanza-de-datos\/\"><strong>herramienta de gobernanza de datos<\/strong><\/a> Puede ser un desaf\u00edo por muchas razones. En primer lugar, el mayor obst\u00e1culo para decidir cualquier cosa relacionada con... <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-es-la-gobernanza-de-datos\/\">gobernanza de datos<\/a><\/strong> La falta de un enfoque estandarizado implica que los objetivos no est\u00e1n bien definidos. Adem\u00e1s, las capacidades de gobernanza de datos de la mayor\u00eda de las herramientas de c\u00f3digo abierto no est\u00e1n claras. Debe revisar la documentaci\u00f3n y el repositorio de GitHub para determinar si una herramienta en particular es adecuada para un caso de uso espec\u00edfico.<\/p>\n<p>Adem\u00e1s, las capacidades de gobernanza de datos de la mayor\u00eda de las herramientas de c\u00f3digo abierto no est\u00e1n claras, por lo que debe revisar la documentaci\u00f3n y los repositorios de GitHub para determinar si una herramienta en particular es adecuada para un caso de uso espec\u00edfico. Para simplificar su proceso de evaluaci\u00f3n, hemos compilado una lista de las mejores herramientas de gobernanza de datos de c\u00f3digo abierto de 2022.<\/p>\n<div id=\"attachment_5150\" style=\"width: 842px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-5150\" decoding=\"async\" class=\"size-full wp-image-5150\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools.png\" alt=\"Las mejores herramientas de gobernanza de datos de c\u00f3digo abierto\" width=\"832\" height=\"498\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools-200x120.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools-300x180.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools-400x239.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools-600x359.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools-768x460.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools-800x479.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Governance_Tools.png 832w\" sizes=\"(max-width: 832px) 100vw, 832px\" \/><p id=\"caption-attachment-5150\" class=\"wp-caption-text\">Las mejores herramientas de gobernanza de datos de c\u00f3digo abierto<\/p><\/div>\n<h3>Mejores herramientas de gobernanza de datos de c\u00f3digo abierto: 1. Amundsen<\/h3>\n<p>Amundsen se cre\u00f3 originalmente en Lyft y actualmente est\u00e1 alojado y mantenido por LF AI &amp; Data Foundation. En cuanto a la gobernanza de datos, se centra principalmente en la seguridad de los datos y el cumplimiento de las leyes de privacidad y soberan\u00eda de datos. La idea es etiquetar y categorizar todos los datos en la capa de metadatos.<\/p>\n<p>Con Amundsen, puede buscar metadatos y saber qui\u00e9n los usa y con qu\u00e9 frecuencia. Puede obtener una idea general de los datos al observar estos patrones de acceso, pero este enfoque es m\u00e1s reactivo. Para un enfoque m\u00e1s proactivo, necesita controles de acceso precisos para evitar que las personas accedan a los datos seg\u00fan las pol\u00edticas de acceso de equipo, rol, individuo, sistema, etc.<\/p>\n<p>Si bien a\u00fan no cuenta con RBAC (control de acceso basado en roles) en Amundsen, a\u00fan cuenta con algunas capacidades esenciales de gobernanza de datos, como etiquetado y categorizaci\u00f3n de metadatos.<\/p>\n<p>Debido a las limitadas capacidades de gobernanza de datos disponibles con el backend predeterminado de Neo4J, Amundsen decidi\u00f3 a\u00f1adir compatibilidad con Apache Atlas. Dado que Apache Atlas es uno de los sistemas m\u00e1s maduros... <a href=\"https:\/\/www.gudusoft.com\/es\/que-es-la-gestion-de-metadatos\/\"><strong>gesti\u00f3n de metadatos<\/strong><\/a> Plataformas, muchas funciones se han probado en diversos sistemas, lo que aporta fiabilidad a las soluciones de catalogaci\u00f3n y gobernanza de datos. Amundsen cuenta con un buen soporte para <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-son-los-datos-de-linaje-y-por-que-son-importantes\/\">linaje de datos<\/a><\/strong> y propagaci\u00f3n de etiquetas\/insignias (usando linaje).<\/p>\n<p>Los backends de Neo4j o Atlas suelen ser adecuados para la mayor\u00eda de las empresas. Algunos usuarios buscan funciones m\u00e1s avanzadas en sus soluciones de catalogaci\u00f3n y gobernanza de datos.<\/p>\n<h3>Mejores herramientas de gobernanza de datos de c\u00f3digo abierto: 2. DataHub<\/h3>\n<p>LinkedIn cre\u00f3 DataHub despu\u00e9s de que WhereHows dejara de ser una soluci\u00f3n viable para la creciente demanda de herramientas de b\u00fasqueda y descubrimiento de metadatos. Antes de DataHub, LinkedIn utilizaba otras herramientas junto con WhereHows para a\u00f1adir capacidades de gobernanza de datos.<\/p>\n<p>DataHub te permite un control de acceso preciso sobre los metadatos. El acceso se rige por pol\u00edticas que puedes declarar desde la interfaz web y la API de GraphQL. La estrategia de DataHub se aplica a dos niveles: plataforma y metadatos. Las pol\u00edticas de plataforma te permiten controlar los permisos de usuario en DataHub; por ejemplo, qu\u00e9 funciones y en qu\u00e9 medida pueden los usuarios verlas y usarlas.<\/p>\n<p>Puede aplicar estas pol\u00edticas a usuarios individuales o grupos. Por otro lado, las pol\u00edticas de metadatos le permiten controlar qu\u00e9 usuarios tienen acceso a diferentes entidades de metadatos, gr\u00e1ficos, fuentes de datos, paneles, etc., y qu\u00e9 acciones pueden realizar en ellos. Sin embargo, DataHub actualmente no permite controlar los permisos de lectura.<\/p>\n<p>Varias otras funciones forman parte de la hoja de ruta de DataHub, pero a\u00fan no hay un cronograma definido. Una de las principales capacidades de gobernanza de datos es RBAC (control de acceso basado en roles) para entidades y aspectos (registros PDL). RBAC no solo proporciona un control de acceso m\u00e1s preciso sobre los metadatos, sino que tambi\u00e9n facilita una mejor gesti\u00f3n de etiquetas, el control de acceso a la vista previa de datos y mucho m\u00e1s.<\/p>\n<p>En t\u00e9rminos de gobernanza\/privacidad: DataHub admite la clasificaci\u00f3n a nivel de conjunto de datos, el movimiento controlado de datos, la eliminaci\u00f3n autom\u00e1tica de datos, la exportaci\u00f3n de datos y m\u00e1s. Planean liberar algunas capacidades de cumplimiento como parte de su plan de trabajo.<\/p>\n<h3>Mejores herramientas de gobernanza de datos de c\u00f3digo abierto: 3. Apache Atlas<\/h3>\n<p>Como uno de los primeros cat\u00e1logos de datos de c\u00f3digo abierto en integrar capacidades de gobernanza de datos, el proyecto Apache Atlas tuvo un ciclo de desarrollo algo lento, adem\u00e1s de que fue dise\u00f1ado espec\u00edficamente para el ecosistema Hadoop. Funciona con cualquier sistema integrado con Hive.<\/p>\n<p>Apache Atlas es especialmente eficaz en la clasificaci\u00f3n, con la capacidad de crear categor\u00edas de sensibilidad, caducidad y calidad de datos sobre la marcha, lo que nos lleva al linaje de datos, otra caracter\u00edstica popular de Apache Atlas. Atlas implementa un linaje de datos real, es decir, el linaje es operativo.<\/p>\n<p>Al utilizar datos de linaje, Apache Atlas puede propagar propiedades de metadatos a entidades en una jerarqu\u00eda de linaje, una caracter\u00edstica que no encontrar\u00e1 en otras herramientas de gobernanza de datos.<\/p>\n<p>Apache Atlas tambi\u00e9n cuenta con diversas funciones de privacidad y seguridad de datos de DE. Por ejemplo, ofrece un control de acceso detallado sobre entidades y categor\u00edas, y funciona bien con Apache Ranger para la autorizaci\u00f3n y el enmascaramiento de datos. Al trabajar en conjunto, estas funciones forman una red eficaz de privacidad y seguridad de datos, que permite proteger o clasificar los datos como informaci\u00f3n personal identificable (PII), informaci\u00f3n sensible, etc. Cabe destacar que tambi\u00e9n proporciona un marco para controlar qui\u00e9n puede acceder a informaci\u00f3n personal identificable (PII) y datos sensibles.<\/p>\n<h3>Mejores herramientas de gobernanza de datos de c\u00f3digo abierto: 4. Magda<\/h3>\n<p>Desarrollado por Data61, la divisi\u00f3n de ciencia de datos de CSIRO (Organizaci\u00f3n de Investigaci\u00f3n Cient\u00edfica e Industrial de la Commonwealth de Australia), MAGDA es un acr\u00f3nimo que significa &quot;Haciendo Disponibles los Datos del Gobierno Australiano&quot;. CSIRO implement\u00f3 Magda para crear un portal de datos abiertos que contiene m\u00e1s de 70.000 conjuntos de datos de los gobiernos federal y estatal de Australia, y ha puesto el proyecto en c\u00f3digo abierto para su uso por parte de terceros.<\/p>\n<p>Aunque las funciones m\u00e1s completas y consolidadas de Magda siguen siendo la b\u00fasqueda y el descubrimiento, tambi\u00e9n ofrece un potente soporte para etiquetar y definir temas de conjuntos de datos. Adem\u00e1s, Magda cuenta con opciones integradas de vista previa de datos, incluyendo hojas de c\u00e1lculo y gr\u00e1ficos interactivos. Otras herramientas, como Amundsen, deben integrarse con Superset. Una advertencia: la integraci\u00f3n con herramientas como Superset para la vista previa de datos es m\u00e1s escalable.<\/p>\n<p>While Magda does not currently support RBAC (role-based access control), it does support features that allow strict control of access to resources ingested into Magda. Magda uses Kubernetes to remain cloud-independent. It uses the open policy broker standard to manage access policies, which facilitates different types of access control, such as role-based, attribute-based, and so on.<\/p>\n<h3>Mejores herramientas de gobernanza de datos de c\u00f3digo abierto: 5. Open Metadata<\/h3>\n<p>Anunciado en agosto de 2021, <strong>Metadatos abiertos<\/strong> Define especificaciones para estandarizar los metadatos utilizando un enfoque que prioriza el esquema, que consiste en un almac\u00e9n de metadatos centralizado y un marco de ingesta que admite conectores populares en la pila de datos.<\/p>\n<p>Open Metadata adopta un enfoque diferente para el etiquetado, que permite etiquetar a los propietarios de datos con conjuntos de datos y en m\u00faltiples capas seg\u00fan su importancia. Open Metadata tambi\u00e9n implementa el control de versiones de todos los metadatos, lo que significa que, con las entidades de la base de datos (tablas, vistas, modo), la etiqueta, la propiedad del conjunto de datos, informaci\u00f3n detallada y vocabulario empresarial relacionado con todos los metadatos para el control de versiones, toda la informaci\u00f3n sobre los cambios, como qui\u00e9n realiz\u00f3 el cambio y cu\u00e1ndo.<\/p>\n<h3>Mejores herramientas de gobernanza de datos de c\u00f3digo abierto: 6. Egeria<\/h3>\n<p>Lanzada en 2019 y mantenida por la divisi\u00f3n de IA y Datos de la Fundaci\u00f3n Linux, Egeria est\u00e1 dise\u00f1ada para intercambiar metadatos f\u00e1cilmente entre herramientas y plataformas de forma independiente del proveedor. Otras herramientas lo hacen mediante SDKS y API, pero sus capacidades son limitadas, mientras que Egeria lo hace bien gracias a sus principios de independencia de plataforma, facilidad de extensibilidad y accesibilidad a los datos.<\/p>\n<p>Si bien todas las dem\u00e1s herramientas que hemos visto hasta ahora abordan cuestiones de gesti\u00f3n y gobernanza de metadatos principalmente desde la perspectiva del usuario, Egeria intenta resolver problemas de usuarios y sistemas, y funciona bien con una variedad de herramientas de datos.<\/p>\n<p>Egeria le ofrece un control muy preciso de sus metadatos mediante regiones de gobernanza, fechas de validez, archivado de metadatos, procedencia de metadatos y m\u00e1s, algunos de los cuales son exclusivos de Egeria. Cabe mencionar tambi\u00e9n que incluye, entre otros, m\u00e1s de 800 funciones predefinidas. <strong><a href=\"https:\/\/www.gudusoft.com\/es\/tipos-de-metadatos\/\">tipos de metadatos<\/a><\/strong>Tambi\u00e9n puede definir sus propios tipos seg\u00fan las necesidades de su negocio, lo que significa que Egeria es lo suficientemente flexible como para adaptarse a sus necesidades comerciales.<\/p>\n<h3>Mejores herramientas de gobernanza de datos de c\u00f3digo abierto: 7. Truedat<\/h3>\n<p>Finalmente, TrueDat, posiblemente la \u00fanica plataforma madura <strong>herramienta de gobernanza de datos de c\u00f3digo abierto<\/strong> En la lista, fue creada por BlueTab (ahora IBM) despu\u00e9s de comprender las necesidades del mercado como proveedor de soluciones de datos y encontrar brechas en el espacio de gobernanza de datos.<\/p>\n<p>TrueDat tiene un conjunto de caracter\u00edsticas superpuestas con las otras herramientas mencionadas anteriormente, incluidas <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-es-el-catalogo-de-datos-por-que-los-datos-registro-de-datos\/\">cat\u00e1logos de datos<\/a><\/strong>, motores de b\u00fasqueda, capacidades de linaje de datos, etc. Aun as\u00ed, las funciones m\u00e1s populares son... <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-es-un-glosario-de-datos\/\">vocabulario de negocios<\/a><\/strong> y la capacidad de compartir datos entre equipos, con controles detallados que se centran en la gesti\u00f3n de datos, la gesti\u00f3n de la propiedad de los datos, la clasificaci\u00f3n, etc.<\/p>\n<p>Existen otras caracter\u00edsticas que hacen de TrueDat un recurso \u00fanico en esta lista, como la funci\u00f3n de intercambio de datos, similar a la de Snowflake, que facilita a los equipos compartir y colaborar de forma m\u00e1s eficaz. Adem\u00e1s, para garantizar un alto nivel de seguridad y control sobre los datos, se pueden utilizar las funciones de suscripci\u00f3n y notificaci\u00f3n para registrar eventos de cambio en registros de auditor\u00eda y monitorizarlos en tiempo real.<\/p>\n<h3>Conclusi\u00f3n<\/h3>\n<p>Gracias por leer nuestro art\u00edculo. Esperamos que le sea \u00fatil si busca las mejores herramientas de gobernanza de datos de c\u00f3digo abierto. Si desea m\u00e1s informaci\u00f3n sobre herramientas de gobernanza de datos de c\u00f3digo abierto, le recomendamos visitar <a href=\"https:\/\/www.gudusoft.com\/es\/\"><strong>Flujo de SQL de Gudu<\/strong><\/a> Para m\u00e1s informaci\u00f3n.<\/p>\n<p>Como uno de los\u00a0<strong><a href=\"https:\/\/www.dpriver.com\/blog\/2022\/05\/11\/best-data-lineage-tools\/\" target=\"_blank\" rel=\"noopener noreferrer\">Las mejores herramientas de linaje de datos<\/a><\/strong>\u00a0Disponible actualmente en el mercado, Gudu SQLFlow no solo puede analizar archivos de script SQL, obtener el linaje de datos y realizar visualizaciones, sino que tambi\u00e9n permite a los usuarios proporcionar\u00a0<strong>linaje de datos<\/strong>\u00a0en formato CSV y realizar visualizaci\u00f3n.\u00a0<strong>(Publicado por Ryan el 16 de julio de 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":5164,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[178],"tags":[299,294,298,268,300,288,75,301,302,291],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/5146"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/comments?post=5146"}],"version-history":[{"count":17,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/5146\/revisions"}],"predecessor-version":[{"id":5165,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/5146\/revisions\/5165"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media\/5164"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media?parent=5146"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/categories?post=5146"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/tags?post=5146"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}