{"id":5124,"date":"2022-07-15T20:26:50","date_gmt":"2022-07-16T04:26:50","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=5124"},"modified":"2022-07-15T20:26:50","modified_gmt":"2022-07-16T04:26:50","slug":"best-open-source-data-catalog-tools","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/es\/las-mejores-herramientas-de-catalogo-de-datos-de-codigo-abierto\/","title":{"rendered":"Las 4 mejores herramientas de cat\u00e1logo de datos de c\u00f3digo abierto para considerar en 2022"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>Las 4 mejores herramientas de cat\u00e1logo de datos de c\u00f3digo abierto de 2022<\/h2>\n<p>Fundamentalmente, cualquier organizaci\u00f3n basada en datos necesita <a href=\"https:\/\/www.gudusoft.com\/es\/mejores-herramientas-de-catalogo-de-datos\/\"><strong>herramientas de cat\u00e1logo de datos<\/strong><\/a>. <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-es-el-catalogo-de-datos-por-que-los-datos-registro-de-datos\/\">Cat\u00e1logos de datos<\/a><\/strong> Ayudan a crear un entorno \u00fanico desde el que se puede acceder a todos los datos de una organizaci\u00f3n y al contexto de esos datos, lo que garantiza que las organizaciones puedan reducir el tiempo de an\u00e1lisis y tomar r\u00e1pidamente decisiones empresariales de alta calidad basadas en datos. Si busca... <strong>Las mejores herramientas de cat\u00e1logo de datos de c\u00f3digo abierto<\/strong>Entonces has llegado al lugar correcto. En esta publicaci\u00f3n, hemos recopilado una lista de... <strong>Las mejores herramientas de cat\u00e1logo de datos de c\u00f3digo abierto de 2022<\/strong> Para hacerte la vida m\u00e1s f\u00e1cil.<\/p>\n<div id=\"attachment_5129\" style=\"width: 828px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-5129\" decoding=\"async\" class=\"size-full wp-image-5129\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools.png\" alt=\"Las mejores herramientas de cat\u00e1logo de datos de c\u00f3digo abierto\" width=\"818\" height=\"471\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-200x115.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-300x173.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-400x230.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-600x345.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-768x442.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-800x461.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools.png 818w\" sizes=\"(max-width: 818px) 100vw, 818px\" \/><p id=\"caption-attachment-5129\" class=\"wp-caption-text\">Las mejores herramientas de cat\u00e1logo de datos de c\u00f3digo abierto<\/p><\/div>\n<h3>Mejores herramientas de cat\u00e1logo de datos de c\u00f3digo abierto: 1. Apache Atlas<\/h3>\n<p>Como c\u00f3digo abierto <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-es-la-gestion-de-metadatos\/\">gesti\u00f3n de metadatos<\/a><\/strong> Apache Atlas, plataforma de herramientas y gobernanza, est\u00e1 incubada por Hortonworks bajo el paraguas de la Iniciativa de Gobernanza de Datos.<\/p>\n<p>Se uni\u00f3 a la Incubadora de la Fundaci\u00f3n Apache en 2015 y creci\u00f3 hasta convertirse en un programa de primer nivel en 2017. Apache Atlas es ampliamente reconocido como uno de los pilares de las plataformas de datos modernas debido a su visi\u00f3n temprana de utilizar metadatos para resolver los desaf\u00edos de catalogaci\u00f3n, clasificaci\u00f3n, descubrimiento, gobernanza y colaboraci\u00f3n de datos.<\/p>\n<p>Principales capacidades de Apache Atlas:<\/p>\n<ol>\n<li><strong>Clasificaci\u00f3n de metadatos:<\/strong> Apache Atlas permite clasificar autom\u00e1ticamente informaci\u00f3n personal identificable (PII), datos confidenciales y otros datos sensibles. Los activos de datos pueden asociarse con m\u00faltiples clasificaciones. Estas pol\u00edticas tambi\u00e9n se propagan a trav\u00e9s del linaje para garantizar que los datos derivados hereden la misma clasificaci\u00f3n y los mismos controles de seguridad.<\/li>\n<li><strong>Tipos e instancias de metadatos:<\/strong> Seg\u00fan la documentaci\u00f3n de Apache, un \u201ctipo\u201d es una definici\u00f3n de c\u00f3mo se almacena y se accede a un tipo espec\u00edfico de objeto de metadatos en Atlas, lo que permite <a href=\"https:\/\/www.gudusoft.com\/es\/administradores-de-datos\/\"><strong>administradores de datos<\/strong><\/a> para definir metadatos t\u00e9cnicos y comerciales.<\/li>\n<li><strong>B\u00fasqueda y linaje:<\/strong> La interfaz intuitiva de Apache Atlas permite la exploraci\u00f3n predefinida y temporal de tipos de datos por tipo, categor\u00eda, valor de atributo o texto libre. Adem\u00e1s, conserva un historial de c\u00f3mo se construy\u00f3 la fuente de datos o los datos expl\u00edcitos y c\u00f3mo evolucion\u00f3 con el tiempo.<\/li>\n<li><strong>Seguridad y enmascaramiento de datos:<\/strong> Apache Atlas es principalmente una herramienta de gobernanza de datos que permite una seguridad detallada del acceso a los metadatos para configurar el control de acceso sobre instancias de entidades, as\u00ed como agregar\/actualizar\/eliminar clasificaciones, etc.<\/li>\n<\/ol>\n<h3>Mejores herramientas de cat\u00e1logo de datos de c\u00f3digo abierto: 2. Amundsen Lyft<\/h3>\n<p>Como plataforma de cat\u00e1logo de datos de c\u00f3digo abierto construida originalmente por el equipo de ingenier\u00eda de Lyft, Amundsen abri\u00f3 el c\u00f3digo fuente en octubre de 2019, un a\u00f1o despu\u00e9s de su lanzamiento para uso interno.<\/p>\n<p>Amundsen tiene una comunidad cohesionada de colaboradores y usuarios, y es ampliamente adoptado por otras organizaciones basadas en esta herramienta de cat\u00e1logo de datos de c\u00f3digo abierto para avanzar en sus iniciativas de democratizaci\u00f3n de datos, gobernanza y servicios de metadatos.<\/p>\n<p><strong>Principales capacidades de Amundsen:<\/strong><\/p>\n<ol>\n<li><strong>Es f\u00e1cil encontrar datos confiables:<\/strong> Amundsen ayuda a encontrar datos de una variedad de fuentes con b\u00fasquedas de texto simples, y los resultados de la b\u00fasqueda incluso muestran metadatos en l\u00ednea.<\/li>\n<li><strong>Metadatos automatizados y seleccionados:<\/strong> Cuando se hace clic en un activo de datos, se muestra al usuario su descripci\u00f3n detallada y su comportamiento, que se seleccionan manualmente y se generan autom\u00e1ticamente, respectivamente.<\/li>\n<li><strong>Capacidad de compartir contexto con colegas:<\/strong> Las descripciones de los activos de datos se pueden actualizar, lo que reduce la necesidad de que los colegas vayan y vengan buscando m\u00e1s contexto para un activo de datos en particular.<\/li>\n<li><strong>Aprenda y comprenda el uso de los datos:<\/strong> Los usuarios pueden ver qu\u00e9 activos de datos se usan con frecuencia, se poseen o se marcan como favoritos, e incluso pueden ver las consultas m\u00e1s comunes relacionadas con las tablas mirando los paneles creados en una tabla determinada.<\/li>\n<\/ol>\n<h3>Mejores herramientas de cat\u00e1logo de datos de c\u00f3digo abierto: 3. LinkedIn DataHub<\/h3>\n<p>Como plataforma de gesti\u00f3n de metadatos de c\u00f3digo abierto desarrollada por el equipo de ingenier\u00eda de LinkedIn, DataHub es realmente el segundo intento de LinkedIn de abordar los desaf\u00edos de la catalogaci\u00f3n, el descubrimiento, la observabilidad y el linaje de datos.<\/p>\n<p>Antes de DataHub, crearon una herramienta de directorio de datos de c\u00f3digo abierto llamada WhereHows en 2016. DataHub se anunci\u00f3 en 2019 y se abri\u00f3 al c\u00f3digo en 2020. Como resultado, LinkedIn mantiene dos versiones diferentes de DataHub: una para uso interno y otra de c\u00f3digo abierto para que otros puedan crearla.<\/p>\n<p><strong>Principales capacidades de DataHub:<\/strong><\/p>\n<ol>\n<li><strong>Ingesta automatizada de metadatos:<\/strong> En LinkedIn DataHub, los metadatos se ingieren desde diferentes fuentes a trav\u00e9s de API o flujo de inserci\u00f3n de Kafka.<\/li>\n<li><strong>Descubrimiento de datos f\u00e1cil:<\/strong> En el nivel m\u00e1s alto para los usuarios finales, el frontend de DataHub admite tres tipos de interacci\u00f3n: buscar, explorar y ver\/editar metadatos.<\/li>\n<li><strong>Comprender los datos a trav\u00e9s del contexto:<\/strong> Cada entidad de datos en DataHub viene con una p\u00e1gina de perfil que muestra todos los metadatos asociados con esa entidad de datos, proporcionando al usuario la informaci\u00f3n necesaria para desarrollar ese contexto de datos.<\/li>\n<\/ol>\n<h3>Mejores herramientas de cat\u00e1logo de datos de c\u00f3digo abierto: 4. Netflix Metacat<\/h3>\n<p>Como servicio de gesti\u00f3n de metadatos conjunto creado por Netflix y de c\u00f3digo abierto en junio de 2018, Metacat tiene como objetivo simplificar la clasificaci\u00f3n, el descubrimiento, el procesamiento y la gesti\u00f3n de datos.<\/p>\n<p>Metacat constituye principalmente una fuente \u00fanica de acceso a todos los recursos de datos de Netflix. Si bien Metacat es un cat\u00e1logo de datos de c\u00f3digo abierto, parece existir una falta de conocimiento p\u00fablico significativo para que otros puedan utilizar su esquema y ampliarlo eficazmente.<\/p>\n<p><strong>Principales capacidades de Metacat:<\/strong><\/p>\n<ol>\n<li><strong>Abstracci\u00f3n de datos e interoperabilidad:<\/strong> Metacat forma una capa de abstracci\u00f3n com\u00fan y se puede acceder a los conjuntos de datos a trav\u00e9s de los m\u00faltiples motores de consulta de Netflix.<\/li>\n<li><strong>Almacenes de metadatos empresariales y definidos por el usuario:<\/strong> Metacat ayuda a documentar metadatos comerciales y definidos por el usuario sobre los activos de datos, garantiza que los usuarios de datos reciban m\u00e1s informaci\u00f3n sobre los activos de datos y reglas est\u00e1ndar sobre c\u00f3mo tratarlos.<\/li>\n<li><strong>Descubrimiento de datos:<\/strong> Metacat proporciona metadatos de esquema y metadatos definidos por el usuario o el negocio para datos a trav\u00e9s de ElasticSearch y esto ayuda a realizar consultas mediante b\u00fasqueda de texto.<\/li>\n<li><strong>Auditor\u00eda y notificaci\u00f3n de cambios de datos:<\/strong> Captura cualquier cambio o actualizaci\u00f3n de metadatos, lo que permite enviar notificaciones autom\u00e1ticas para aquellos eventos que puedan requerir la atenci\u00f3n del usuario.<\/li>\n<\/ol>\n<h3>\u00bfCu\u00e1les son los beneficios de las herramientas de cat\u00e1logo de datos de c\u00f3digo abierto?<\/h3>\n<p>Los cat\u00e1logos de datos de alta calidad no solo le permiten categorizar adecuadamente todos sus datos, sino que tambi\u00e9n le permiten rastrear adecuadamente los flujos de datos entre diferentes tipos de datos e incluso le muestran fallas en los flujos de datos que puede mejorar.<\/p>\n<p>Otra caracter\u00edstica interesante es que tambi\u00e9n se pueden gestionar datos sensibles, y la herramienta puede identificar d\u00f3nde se muestran con mayor frecuencia, reduciendo as\u00ed el riesgo de fugas. Algunas herramientas de cat\u00e1logo de datos de alta gama incluso ofrecen funciones de aprendizaje autom\u00e1tico que pueden comprender c\u00f3mo se gestionan los datos y ayudar a procesar grandes cantidades de datos. Pero \u00bfpor qu\u00e9 usar la herramienta de directorio de datos de c\u00f3digo abierto?<\/p>\n<p>Las herramientas de cat\u00e1logo de datos de c\u00f3digo abierto siguen siendo software de alta calidad, econ\u00f3micos, a veces incluso gratuitos, pero escalan bien, ofrecen muchas opciones de personalizaci\u00f3n y pueden funcionar sin limitaciones, lo que es ideal para grandes vol\u00famenes de datos.<\/p>\n<p>M\u00e1s all\u00e1 de eso, como empresa u organizaci\u00f3n, no tiene que preocuparse por depender de un solo desarrollador para las actualizaciones, ya que puede contratar desarrolladores para desarrollar a\u00fan m\u00e1s el software de c\u00f3digo abierto o personalizarlo f\u00e1cilmente para adaptarlo a sus necesidades.<\/p>\n<h3>Conclusi\u00f3n<\/h3>\n<p>Gracias por leer nuestro art\u00edculo y esperamos que pueda ayudarle a encontrar la <strong>Las mejores herramientas de cat\u00e1logo de datos de c\u00f3digo abierto<\/strong> en 2022. Si desea obtener m\u00e1s informaci\u00f3n sobre las herramientas de cat\u00e1logo de datos de c\u00f3digo abierto, le recomendamos visitar <a href=\"https:\/\/www.gudusoft.com\/es\/\"><strong>Flujo de SQL de Gudu<\/strong><\/a> Para m\u00e1s informaci\u00f3n.<\/p>\n<p>Como uno de los\u00a0<strong><a href=\"https:\/\/www.dpriver.com\/blog\/2022\/05\/11\/best-data-lineage-tools\/\" target=\"_blank\" rel=\"noopener noreferrer\">Las mejores herramientas de linaje de datos<\/a><\/strong>\u00a0Disponible en el mercado hoy en d\u00eda, Gudu SQLFlow no solo puede analizar archivos de script SQL, obtener\u00a0<a href=\"https:\/\/www.gudusoft.com\/es\/que-son-los-datos-de-linaje-y-por-que-son-importantes\/\"><strong>linaje de datos<\/strong><\/a>, y realizar una visualizaci\u00f3n, pero tambi\u00e9n permitir a los usuarios proporcionar el linaje de datos en formato CSV y realizar una visualizaci\u00f3n.\u00a0<strong>(Publicado por Ryan el 16 de julio de 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":5141,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[178],"tags":[295,294,292,98,296,151,297,293],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/5124"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/comments?post=5124"}],"version-history":[{"count":18,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/5124\/revisions"}],"predecessor-version":[{"id":5144,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/5124\/revisions\/5144"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media\/5141"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media?parent=5124"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/categories?post=5124"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/tags?post=5124"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}