{"id":4639,"date":"2022-06-24T23:29:41","date_gmt":"2022-06-25T07:29:41","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=4639"},"modified":"2022-06-27T18:36:48","modified_gmt":"2022-06-28T02:36:48","slug":"metadata-management-for-data-warehouses","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/es\/gestion-de-metadatos-para-almacenes-de-datos\/","title":{"rendered":"Gesti\u00f3n de metadatos para almacenes de datos | Gudu SQLFlow"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>Gesti\u00f3n de metadatos para almacenes de datos<\/h2>\n<p><strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-es-la-gestion-de-metadatos\/\">Gesti\u00f3n de metadatos<\/a><\/strong> es la base de la empresa <strong><a href=\"https:\/\/www.gudusoft.com\/es\/category\/data-governance-101\/\">gobernanza de datos<\/a><\/strong> y la mejora de <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-es-un-almacen-de-datos-2\/\">almac\u00e9n de datos<\/a><\/strong>Como alguien que trabaja frecuentemente con datos, mi primera tarea es comprender la gesti\u00f3n de metadatos. Este art\u00edculo explicar\u00e1 el concepto de metadatos y presentar\u00e1 la gesti\u00f3n de metadatos para almacenes de datos.<\/p>\n<h3>\u00bfQu\u00e9 es la gesti\u00f3n de metadatos para almacenes de datos?<\/h3>\n<p>Antes de continuar, veamos <strong>\u00bfQu\u00e9 son los metadatos?<\/strong> y <strong>\u00bfQu\u00e9 es un almac\u00e9n de datos?<\/strong>.<\/p>\n<p><strong>Metadatos<\/strong>Los metadatos, tambi\u00e9n conocidos como datos intermediarios y datos de retransmisi\u00f3n, son datos sobre datos. Generalmente, los metadatos se dividen en metadatos comerciales y metadatos t\u00e9cnicos seg\u00fan sus diferentes significados.<\/p>\n<p>A <strong>almac\u00e9n de datos<\/strong> Es un repositorio central de informaci\u00f3n que puede analizarse para tomar mejores decisiones. Normalmente, los datos fluyen regularmente a un almac\u00e9n de datos desde sistemas transaccionales, bases de datos relacionales y otras fuentes. Los analistas de negocios... <strong><a href=\"https:\/\/www.gudusoft.com\/es\/ingenieros-de-datos\/\">ingenieros de datos<\/a><\/strong>, <a href=\"https:\/\/www.gudusoft.com\/es\/cientificos-de-datos\/\"><strong>cient\u00edficos de datos<\/strong><\/a>y los tomadores de decisiones acceden a los datos a trav\u00e9s de herramientas de inteligencia empresarial (BI), clientes SQL y otras aplicaciones anal\u00edticas.<\/p>\n<div id=\"attachment_4664\" style=\"width: 955px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-4664\" decoding=\"async\" class=\"size-full wp-image-4664\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2.png\" alt=\"Gesti\u00f3n de metadatos para almacenes de datos\" width=\"945\" height=\"532\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2-200x113.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2-300x169.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2-400x225.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2-600x338.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2-768x432.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2-800x450.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2.png 945w\" sizes=\"(max-width: 945px) 100vw, 945px\" \/><p id=\"caption-attachment-4664\" class=\"wp-caption-text\">Gesti\u00f3n de metadatos para almacenes de datos<\/p><\/div>\n<p><strong>\u00bfQu\u00e9 es entonces la gesti\u00f3n de metadatos para los almacenes de datos?<\/strong><\/p>\n<p>Los metadatos en el almac\u00e9n de datos registran principalmente la definici\u00f3n de cada tema, la relaci\u00f3n de mapeo entre diferentes niveles, el estado de los datos del almac\u00e9n de datos de monitoreo y el estado de ejecuci\u00f3n de la tarea. <a href=\"https:\/\/www.gudusoft.com\/es\/mejores-herramientas-etl\/\"><strong>ETL<\/strong><\/a>Generalmente, los metadatos se almacenan y gestionan de manera uniforme a trav\u00e9s del repositorio de metadatos, y su objetivo principal es lograr coordinaci\u00f3n y coherencia en el dise\u00f1o, la implementaci\u00f3n, la operaci\u00f3n y la gesti\u00f3n del almac\u00e9n de datos.<\/p>\n<p>Los metadatos son una parte importante del sistema de gesti\u00f3n de almacenes de datos. La gesti\u00f3n de metadatos es un componente clave en los almacenes de datos empresariales. Atraviesa todo el proceso de construcci\u00f3n de un almac\u00e9n de datos e influye directamente en su construcci\u00f3n, uso y mantenimiento.<\/p>\n<h3>\u00bfPor qu\u00e9 los almacenes de datos necesitan gesti\u00f3n de metadatos?<\/h3>\n<ol>\n<li><strong>Imprescindible para la creaci\u00f3n de almacenes de datos<\/strong>El almac\u00e9n de datos se obtiene a partir de datos externos, datos empresariales y documentos mediante herramientas ETL. Sin una regla clara y concisa, es imposible implementar este proceso.<\/li>\n<li><strong>Ayuda a comprender r\u00e1pidamente el sistema de almacenamiento de datos.<\/strong>Por un lado, el almac\u00e9n de datos es esencialmente un proyecto importante para un departamento o incluso una empresa, y su desarrollo requiere un tiempo considerable. Inevitablemente, habr\u00e1 un flujo constante de personal. La falta de metadatos claros tendr\u00e1 un impacto significativo en todo el sistema y el proyecto. Por otro lado, el almac\u00e9n de datos sirve como plataforma de exportaci\u00f3n de datos anal\u00edticos para todo el departamento y la empresa, no solo para el personal encargado de los datos. La capa DM es esencial para el personal de negocios y la capa DIM para otros desarrolladores. Si existen metadatos claros que describan el sistema de almac\u00e9n de datos, se ahorrar\u00e1 mucho tiempo de comunicaci\u00f3n entre ambas partes.<\/li>\n<li><strong>Comunicaci\u00f3n eficiente y precisa<\/strong>Por un lado, los metadatos de gesti\u00f3n registran los permisos de datos de diferentes usuarios, roles y departamentos. Si hay datos que requieren notificaci\u00f3n, se puede consultar r\u00e1pidamente el sistema para comunicarse mediante correos electr\u00f3nicos masivos, etc., evitando as\u00ed la falta de personal y el exceso de personas en la comunicaci\u00f3n. Por otro lado, al comunicarse con productos o con I+D, se puede confirmar el significado de los indicadores y dimensiones de la comunicaci\u00f3n mutua bas\u00e1ndose en los metadatos empresariales, evitando as\u00ed la ambig\u00fcedad en la comunicaci\u00f3n y mejorando as\u00ed la eficiencia.<\/li>\n<li><strong>Garantizado<\/strong> <a href=\"https:\/\/www.gudusoft.com\/es\/como-mejorar-la-calidad-de-los-datos\/\"><strong>calidad de los datos<\/strong><\/a>:Los metadatos ideales describen la estructura del almac\u00e9n de datos, el esquema del almac\u00e9n, las dimensiones, medidas, jerarqu\u00edas, definiciones de las bases de datos en todas partes y la ubicaci\u00f3n y el contenido de las <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-es-un-almacen-de-datos\/\">almacenes de datos<\/a><\/strong>Por lo tanto, podemos determinar con certeza qu\u00e9 datos son realmente precisos, cu\u00e1les podr\u00edan ser err\u00f3neos y cu\u00e1les son definitivamente err\u00f3neos. En resumen, cada campo debe tener su rango de valores, definici\u00f3n de negocio y otra informaci\u00f3n. Una vez definidos los metadatos, se pueden aplicar a la detecci\u00f3n y evaluaci\u00f3n de la calidad de los datos, entre otros aspectos, para mejorar significativamente la calidad de los datos de las empresas mediante el proceso de gesti\u00f3n de la calidad de los datos.<\/li>\n<li><strong>Reducir los costos de construcci\u00f3n del sistema de datos<\/strong>:Si los metadatos est\u00e1n bien establecidos, la informaci\u00f3n se obtendr\u00e1 con mayor precisi\u00f3n y rapidez, de modo que la construcci\u00f3n del sistema de datos no tendr\u00e1 que reelaborarse o tendr\u00e1 que reelaborarse menos, se reducir\u00e1 la carga de trabajo del an\u00e1lisis, se fortalecer\u00e1 la comprensi\u00f3n unificada y la eficiencia de la comunicaci\u00f3n de todas las partes y se minimizar\u00e1 el costo de desarrollo.<\/li>\n<li><strong>Analice r\u00e1pidamente el impacto del cambio<\/strong>Debido a que los metadatos se mantienen y gestionan de forma centralizada con relaciones de referencia, cuando se producen cambios, el sistema de gesti\u00f3n de metadatos se puede utilizar para analizar en tiempo real las funciones de negocio afectadas, los sistemas de aplicaci\u00f3n, el personal involucrado y si hay supervisi\u00f3n involucrada.<\/li>\n<li><strong>Prep\u00e1rese para el futuro<\/strong>:Sistemas de aplicaci\u00f3n a nivel estrat\u00e9gico de las empresas como big data, inteligencia artificial, <a href=\"https:\/\/www.gudusoft.com\/es\/que-es-un-lago-de-datos\/\"><strong>lago de datos<\/strong><\/a>, los centros de datos y la inteligencia empresarial pueden confiar en una buena gesti\u00f3n de metadatos para ejercer los efectos adecuados.<\/li>\n<\/ol>\n<h3>Escenarios de aplicaci\u00f3n de metadatos<\/h3>\n<ol>\n<li><strong>An\u00e1lisis de impacto<\/strong>Durante el desarrollo, nos encontramos con frecuencia con los siguientes problemas: Si quiero modificar una tabla o un ETL, \u00bfcu\u00e1l ser\u00e1 el impacto? Si no hay metadatos, podr\u00edamos tener que revisar todos los scripts y datos para obtener la respuesta deseada; sin embargo, con una gesti\u00f3n de metadatos s\u00f3lida, podemos obtener la respuesta directamente y ahorrar mucho tiempo.<\/li>\n<li><a href=\"https:\/\/www.gudusoft.com\/es\/que-son-los-datos-de-linaje-y-por-que-son-importantes\/\"><strong>An\u00e1lisis del linaje de datos<\/strong><\/a>El an\u00e1lisis de linaje de datos es un m\u00e9todo t\u00e9cnico que permite realizar un seguimiento exhaustivo del proceso de procesamiento de datos, identificando todos los objetos de metadatos relacionados a partir de un objeto de datos y la relaci\u00f3n entre ellos. La relaci\u00f3n entre objetos de metadatos se refiere espec\u00edficamente a la relaci\u00f3n de entrada y salida del flujo de datos que los representa. Una vez creado el sistema de gesti\u00f3n de metadatos, podemos analizar la salud, la distribuci\u00f3n, la concentraci\u00f3n y la intensidad de los datos en el almac\u00e9n de datos mediante el an\u00e1lisis de relaciones de linaje.<\/li>\n<li><strong>Gesti\u00f3n de automatizaci\u00f3n ETL<\/strong>En el almac\u00e9n, gran parte del proceso ETL consiste en pasos tediosos y repetitivos. Por ejemplo, en la capa ODS del sistema fuente: entrada de tabla - salida de tabla. Otro ejemplo es ODS-DW: entrada SQL - limpieza de datos - procesamiento de datos - salida de tabla. Las reglas anteriores forman parte de los metadatos. Esto se puede lograr, en teor\u00eda, escribiendo un script fijo y seleccion\u00e1ndolo a trav\u00e9s del frontend o la interfaz API. De esta manera, se puede gestionar autom\u00e1ticamente el proceso ETL repetido para reducir el tiempo de desarrollo.<\/li>\n<li><strong>Gesti\u00f3n de la calidad de los datos<\/strong>La l\u00f3gica de limpieza de datos se puede dividir simplemente en diferentes tipos de datos y columnas de procesamiento especiales designadas. Solo necesitamos especificar reglas de limpieza predeterminadas para diferentes tipos de datos y una l\u00f3gica de procesamiento especial para algunas columnas espec\u00edficas para lograr una limpieza de datos inteligente y r\u00e1pida. La gesti\u00f3n de la calidad de los datos se encuentra en la intersecci\u00f3n de la gobernanza de datos y la gesti\u00f3n de metadatos, y se inclina m\u00e1s hacia la gobernanza de datos.<\/li>\n<li><strong>Gesti\u00f3n de la seguridad de los datos<\/strong>En el centro de datos que recomienda Ali, todos los indicadores de interfaz de datos se exportar\u00e1n desde el almac\u00e9n de datos. Por lo tanto, en teor\u00eda, solo es necesario configurar el permiso de gesti\u00f3n de metadatos para garantizar la seguridad de los datos de toda la empresa.<\/li>\n<\/ol>\n<h3>Conclusi\u00f3n<\/h3>\n<p>Gracias por leer nuestro art\u00edculo y esperamos que pueda ayudarle a tener una mejor comprensi\u00f3n de <strong>gesti\u00f3n de metadatos para almacenes de datos<\/strong>Si desea obtener m\u00e1s informaci\u00f3n sobre la gesti\u00f3n de metadatos para almacenes de datos, le recomendamos visitar <strong><a href=\"https:\/\/www.gudusoft.com\/es\/\">Flujo de SQL de Gudu<\/a><\/strong> Para m\u00e1s informaci\u00f3n.<\/p>\n<p>Como uno de los\u00a0<strong><a href=\"https:\/\/www.dpriver.com\/blog\/2022\/05\/11\/best-data-lineage-tools\/\" target=\"_blank\" rel=\"noopener noreferrer\">Las mejores herramientas de linaje de datos<\/a><\/strong> Disponible actualmente en el mercado, Gudu SQLFlow no solo puede analizar archivos de script SQL, obtener linaje de datos y realizar una visualizaci\u00f3n, sino que tambi\u00e9n permite a los usuarios proporcionar linaje de datos en formato CSV y realizar una visualizaci\u00f3n.\u00a0<strong>(Publicado por Ryan el 25 de junio de 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":4663,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[178],"tags":[210,152,213,151,211,212],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/4639"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/comments?post=4639"}],"version-history":[{"count":28,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/4639\/revisions"}],"predecessor-version":[{"id":4669,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/4639\/revisions\/4669"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media\/4663"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media?parent=4639"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/categories?post=4639"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/tags?post=4639"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}