{"id":4770,"date":"2022-06-27T20:45:43","date_gmt":"2022-06-28T04:45:43","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=4770"},"modified":"2022-09-17T14:26:49","modified_gmt":"2022-09-17T22:26:49","slug":"open-source-metadata-management-tool","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/es\/herramienta-de-gestion-de-metadatos-de-codigo-abierto\/","title":{"rendered":"Marquez: una herramienta de gesti\u00f3n de metadatos de c\u00f3digo abierto"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>Marquez: una herramienta de gesti\u00f3n de metadatos de c\u00f3digo abierto<\/h2>\n<p>Marquez es un servicio de metadatos de c\u00f3digo abierto para la recopilaci\u00f3n, agregaci\u00f3n y visualizaci\u00f3n de metadatos del ecosistema de datos. Gestiona el consumo y la producci\u00f3n de conjuntos de datos, proporciona visibilidad global del tiempo de ejecuci\u00f3n de los trabajos y la frecuencia de acceso a los conjuntos de datos, proporciona una gesti\u00f3n centralizada del ciclo de vida de los conjuntos de datos y mucho m\u00e1s. WeWork lanz\u00f3 Marquez de c\u00f3digo abierto.<\/p>\n<div id=\"attachment_4774\" style=\"width: 810px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-4774\" decoding=\"async\" class=\"size-fusion-800 wp-image-4774\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-800x827.png\" alt=\"Herramienta de gesti\u00f3n de metadatos de c\u00f3digo abierto\" width=\"800\" height=\"827\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-200x207.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-290x300.png 290w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-400x413.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-600x620.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-768x794.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-800x827.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-991x1024.png 991w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool.png 1078w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><p id=\"caption-attachment-4774\" class=\"wp-caption-text\">Herramienta de gesti\u00f3n de metadatos de c\u00f3digo abierto<\/p><\/div>\n<h3>Caracter\u00edsticas de M\u00e1rquez:<\/h3>\n<p>1. La gesti\u00f3n centralizada de metadatos admite:<\/p>\n<ul>\n<li><strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-son-los-datos-de-linaje-y-por-que-son-importantes\/\">Linaje de datos<\/a><\/strong><\/li>\n<li>Gobernanza de datos<\/li>\n<li>Salud de los datos<\/li>\n<li>Descubrimiento y exploraci\u00f3n de datos<\/li>\n<\/ul>\n<p>2. Modelo de datos preciso de alta dimensi\u00f3n:<\/p>\n<ul>\n<li>Empleos<\/li>\n<li>Conjuntos de datos<\/li>\n<\/ul>\n<p>3. Recopile metadatos f\u00e1cilmente a trav\u00e9s de API de metadatos espec\u00edficas:<\/p>\n<ul>\n<li>Preste atenci\u00f3n a los datos del conjunto de datos<\/li>\n<li>Reforzar la propiedad del trabajo y del conjunto de datos<\/li>\n<li>Operaci\u00f3n y dise\u00f1o simples con dependencias m\u00ednimas<\/li>\n<\/ul>\n<p>4. La API RESTful admite una integraci\u00f3n compleja con otros sistemas:<\/p>\n<ul>\n<li>\u00a0Flujo de aire<\/li>\n<li>Amundsen<\/li>\n<li>\u00a0Dagster<\/li>\n<li>Dise\u00f1ado para promover un ecosistema de datos saludable donde los miembros del equipo de una organizaci\u00f3n puedan compartir sin problemas y confiar de forma segura en los conjuntos de datos de los dem\u00e1s.<\/li>\n<\/ul>\n<h3>\u00bfPor qu\u00e9 elegir M\u00e1rquez?<\/h3>\n<p>Marquez admite consultas de linaje de datos altamente flexibles en conjuntos de datos completos, al mismo tiempo que correlaciona de manera confiable y eficiente los trabajos y sus dependencias (ascendentes y descendentes) entre la generaci\u00f3n y el consumo de conjuntos de datos.<\/p>\n<h3>El dise\u00f1o de M\u00e1rquez<\/h3>\n<p>Marquez es un sistema modular que permite <a href=\"https:\/\/www.gudusoft.com\/es\/que-es-la-gestion-de-metadatos\/\"><strong>gesti\u00f3n de metadatos<\/strong><\/a> Como una soluci\u00f3n desplataforma altamente escalable y extensible. Consta de los siguientes sistemas:<\/p>\n<ul>\n<li>Repositorio de metadatos: almacena todos los metadatos de trabajos y conjuntos de datos, incluido el historial completo de ejecuciones de trabajos y las estad\u00edsticas a nivel de trabajo (por ejemplo: tiempo total de ejecuci\u00f3n, tiempo de ejecuci\u00f3n promedio, \u00e9xito\/fracaso, etc.).<\/li>\n<li>API de metadatos: una API RESTful permite que un conjunto diverso de clientes recopilen metadatos sobre la producci\u00f3n y el consumo de conjuntos de datos.<\/li>\n<li>Interfaz de usuario de metadatos: para descubrir conjuntos de datos, conectar m\u00faltiples conjuntos de datos y explorar su gr\u00e1fico de dependencia.<\/li>\n<\/ul>\n<div id=\"attachment_4778\" style=\"width: 810px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-4778\" decoding=\"async\" class=\"size-fusion-800 wp-image-4778\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-2-800x715.png\" alt=\"Herramienta de gesti\u00f3n de metadatos de c\u00f3digo abierto\" width=\"800\" height=\"715\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-2-200x179.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-2-300x268.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-2-400x358.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-2-600x536.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-2-768x687.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-2-800x715.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-2.png 915w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><p id=\"caption-attachment-4778\" class=\"wp-caption-text\">Herramienta de gesti\u00f3n de metadatos de c\u00f3digo abierto<\/p><\/div>\n<p>Para facilitar la adopci\u00f3n y permitir que la recopilaci\u00f3n de metadatos sea un requisito fundamental en el dise\u00f1o de diferentes aplicaciones de procesamiento de datos, Marquez proporciona clientes espec\u00edficos para cada lenguaje que implementan la API de metadatos. Como parte de la versi\u00f3n inicial, es compatible con Java y Python.<\/p>\n<p>La API de metadatos es una abstracci\u00f3n para registrar informaci\u00f3n sobre la producci\u00f3n y el uso de conjuntos de datos. Es una capa sin estado de baja latencia y alta disponibilidad, responsable de encapsular metadatos persistentes e informaci\u00f3n de linaje de colecciones. La API permite a los clientes recopilar u obtener informaci\u00f3n de conjuntos de datos de un repositorio de metadatos.<\/p>\n<p>Es necesario recopilar, organizar y almacenar metadatos para realizar consultas exploratorias exhaustivas mediante la interfaz de metadatos. El repositorio de metadatos es un cat\u00e1logo abstracto de informaci\u00f3n de conjuntos de datos, comprimido y depurado por la API de metadatos.<\/p>\n<h3>El modelo de datos de M\u00e1rquez<\/h3>\n<p>El modelo de datos de M\u00e1rquez enfatiza la inmutabilidad y el procesamiento justo a tiempo de los conjuntos de datos. Los conjuntos de datos se generan mediante ejecuciones de trabajos, y su valor es importante. Las ejecuciones de trabajos se vinculan con c\u00f3digos de versi\u00f3n y producen una o m\u00e1s salidas de versi\u00f3n inmutables. Los cambios en el conjunto de datos se registran en varios puntos de la ejecuci\u00f3n del trabajo, incluyendo el \u00e9xito o el fracaso de la ejecuci\u00f3n, mediante llamadas a la API ligera.<\/p>\n<p>La siguiente figura muestra los metadatos recopilados y catalogados para un trabajo determinado en m\u00faltiples ejecuciones, y los cambios de series de tiempo aplicados a su conjunto de datos de entrada.<\/p>\n<div id=\"attachment_4780\" style=\"width: 810px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-4780\" decoding=\"async\" class=\"size-fusion-800 wp-image-4780\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-3-800x260.png\" alt=\"Herramienta de gesti\u00f3n de metadatos de c\u00f3digo abierto\" width=\"800\" height=\"260\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-3-200x65.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-3-300x98.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-3-400x130.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-3-600x195.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-3-768x250.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-3-800x260.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-3-1024x333.png 1024w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Open_Source_Metadata_Management_Tool-3.png 1080w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><p id=\"caption-attachment-4780\" class=\"wp-caption-text\">Herramienta de gesti\u00f3n de metadatos de c\u00f3digo abierto<\/p><\/div>\n<ul>\n<li>Trabajo: El trabajo contiene un propietario, un nombre \u00fanico, una versi\u00f3n y una descripci\u00f3n opcional. Un trabajo define una o m\u00e1s entradas de versi\u00f3n como dependencias y una o m\u00e1s salidas de versi\u00f3n como artefactos. Tenga en cuenta que un trabajo puede definir solo conjuntos de datos de entrada o solo conjuntos de datos de salida.<\/li>\n<li>Versi\u00f3n del trabajo: Una versi\u00f3n inmutable de solo lectura del trabajo, con un enlace de referencia \u00fanica, codificada en el almacenamiento para garantizar la reproducci\u00f3n del c\u00f3digo fuente. Una versi\u00f3n del trabajo asocia uno o m\u00e1s conjuntos de datos de entrada y salida a una definici\u00f3n de trabajo (el flujo de datos entre varios trabajos es importante para documentar la informaci\u00f3n de linaje). Estas asociaciones categorizan los enlaces de origen y proporcionan un flujo visual de datos eficaz.<\/li>\n<li>Conjunto de datos: Un conjunto de datos tiene un propietario, un nombre \u00fanico, un esquema, una versi\u00f3n y una descripci\u00f3n opcional. El conjunto de datos se encuentra en la fuente de datos. Las fuentes de datos pueden agrupar conjuntos de datos f\u00edsicos en sus fuentes f\u00edsicas. Cada conjunto de datos tiene un puntero de versi\u00f3n al conjunto de cambios hist\u00f3rico, mantenido por Marquez. Cuando los cambios del conjunto de datos se confirman en Marquez, se genera un ID de versi\u00f3n \u00fanico, se almacena y se establece en la versi\u00f3n actual. El puntero se actualiza internamente.<\/li>\n<li>Versi\u00f3n del conjunto de datos: La versi\u00f3n inmutable de solo lectura del conjunto de datos. Cada versi\u00f3n se puede leer de forma independiente, tiene un ID \u00fanico y se asigna a los cambios del conjunto de datos para preservar su estado en un momento espec\u00edfico. El ID de la \u00faltima versi\u00f3n solo se actualiza cuando se registran los cambios en el conjunto de datos. Para calcular los distintos ID de versi\u00f3n, Marquez aplica funciones de control de versiones a un conjunto de propiedades correspondientes al conjunto de datos de la fuente de datos subyacente.<\/li>\n<\/ul>\n<h3>Conclusi\u00f3n<\/h3>\n<p>Gracias por leer nuestro art\u00edculo. Esperamos que le ayude a comprender mejor Marquez: una herramienta de gesti\u00f3n de metadatos de c\u00f3digo abierto. Si desea obtener m\u00e1s informaci\u00f3n sobre la gesti\u00f3n de metadatos, le recomendamos visitar <a href=\"https:\/\/www.gudusoft.com\/es\/\"><strong>Flujo de SQL de Gudu<\/strong><\/a> Para m\u00e1s informaci\u00f3n.<\/p>\n<p>Como uno de los\u00a0<strong><a href=\"https:\/\/www.dpriver.com\/blog\/2022\/05\/11\/best-data-lineage-tools\/\" target=\"_blank\" rel=\"noopener noreferrer\">Las mejores herramientas de linaje de datos<\/a><\/strong>\u00a0Disponible actualmente en el mercado, Gudu SQLFlow no solo puede analizar archivos de script SQL, obtener linaje de datos y realizar una visualizaci\u00f3n, sino que tambi\u00e9n permite a los usuarios proporcionar linaje de datos en formato CSV y realizar una visualizaci\u00f3n.\u00a0<strong>(Publicado por Ryan el 28 de junio de 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":4786,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[178],"tags":[230,228,152,227,229,232,231],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/4770"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/comments?post=4770"}],"version-history":[{"count":14,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/4770\/revisions"}],"predecessor-version":[{"id":4790,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/4770\/revisions\/4790"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media\/4786"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media?parent=4770"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/categories?post=4770"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/tags?post=4770"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}