{"id":3311,"date":"2022-04-18T17:33:06","date_gmt":"2022-04-19T01:33:06","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=3311"},"modified":"2022-07-03T04:35:23","modified_gmt":"2022-07-03T12:35:23","slug":"whats-data-lineage-why-important","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/es\/que-son-los-datos-de-linaje-y-por-que-son-importantes\/","title":{"rendered":"\u00bfQu\u00e9 es el linaje de datos? | \u00bfPor qu\u00e9 es tan importante?"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h1><strong><b>\u00bfQu\u00e9 es el linaje de datos? | \u00bfPor qu\u00e9 es tan importante?<\/b><\/strong><\/h1>\n<p style=\"text-align: left\">Hoy en d\u00eda, con el r\u00e1pido desarrollo de la econom\u00eda y la tecnolog\u00eda, estamos rodeados de todo tipo de datos, y casi todos los aspectos de nuestro negocio dependen de ellos de alguna manera. Cuando estamos ocupados decidiendo la mejor manera de gestionar nuestros datos, podemos sentir que no tenemos tiempo para analizar sus verdaderos beneficios para nuestra empresa. Considere esto: los datos deben estar disponibles para nuestra empresa las 24 horas del d\u00eda, los 7 d\u00edas de la semana. Para ello, comprender los detalles de su origen, c\u00f3mo llegaron all\u00ed y c\u00f3mo circularon dentro de la empresa es fundamental para su valor.<\/p>\n<div id=\"attachment_3510\" style=\"width: 586px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-3510\" decoding=\"async\" class=\"size-full wp-image-3510\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/Data_Lineage-2.png\" alt=\"Linaje de datos\" width=\"576\" height=\"384\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/Data_Lineage-2-200x133.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/Data_Lineage-2-300x200.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/Data_Lineage-2-400x267.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/Data_Lineage-2.png 576w\" sizes=\"(max-width: 576px) 100vw, 576px\" \/><p id=\"caption-attachment-3510\" class=\"wp-caption-text\">Linaje de datos<\/p><\/div>\n<p style=\"text-align: left\">Aporte\u00a0<a href=\"https:\/\/www.gudusoft.com\/es\/blog\/sqlflow-visualize-data-lineage-stored-procedure\/\"><strong><b>linaje de datos<\/b><\/strong><\/a>, una herramienta exquisita para descubrir el origen de la mina de oro, comprenderla y garantizar que llegue a manos de quienes m\u00e1s la necesitan. As\u00ed que...\u00a0<strong><b>\u00bfQu\u00e9 es el linaje de datos?<\/b><\/strong>\u00bfPor qu\u00e9 es tan importante el linaje de datos? En esta publicaci\u00f3n, analizaremos m\u00e1s a fondo...\u00a0<strong><b>linaje de datos<\/b><\/strong>.<\/p>\n<h2><strong><b>\u00bfQu\u00e9 es el linaje de datos?<\/b><\/strong><\/h2>\n<p>Es el pedigr\u00ed de los datos. En resumen, se refiere a un registro de c\u00f3mo llegaron los datos a una ubicaci\u00f3n espec\u00edfica, as\u00ed como de los pasos intermedios y las transformaciones que ocurren a medida que los datos se mueven a trav\u00e9s del sistema empresarial. En esencia, el\u00a0<strong><b>linaje de datos<\/b><\/strong>\u00a0nos proporciona un mapa detallado del recorrido de los datos, incluidos todos los pasos del camino, como se muestra arriba.<\/p>\n<h2><strong><b>Linaje de datos vs. Procedencia de datos<\/b><\/strong><\/h2>\n<p>El concepto de procedencia de los datos est\u00e1 relacionado con su linaje. Se refiere a la fuente de los datos. Con base en la procedencia, podemos hacer suposiciones sobre la confiabilidad y calidad de los datos.\u00a0<strong><b>almac\u00e9n de datos<\/b><\/strong>\u00a0y\u00a0<strong><b><a href=\"https:\/\/en.wikipedia.org\/wiki\/Data_lake\">lago de datos<\/a> administradores<\/b><\/strong>\u00a0Deber\u00eda centrarse en el seguimiento de la procedencia y el linaje de los datos. Los aspectos clave de la gesti\u00f3n de metadatos incluyen saber d\u00f3nde y cu\u00e1ndo se originaron, qui\u00e9n los manipul\u00f3 y c\u00f3mo modificarlos.<\/p>\n<h2><strong><b>\u00bfPor qu\u00e9 es tan importante el linaje de datos?<\/b><\/strong><\/h2>\n<p>Conocer la procedencia y el linaje de los datos es muy importante por las siguientes razones:<\/p>\n<p>En primer lugar, podemos evaluar la credibilidad de los datos seg\u00fan su procedencia. Adem\u00e1s, nos ayuda a comprender y corregir las fuentes de errores. Adem\u00e1s, nos permite identificar suposiciones err\u00f3neas sobre los datos que podr\u00edan distorsionar el an\u00e1lisis. Adem\u00e1s, proporciona registros de auditor\u00eda para la gobernanza de datos y fines regulatorios. Adem\u00e1s, con su ayuda, podemos garantizar que los flujos de datos est\u00e9n protegidos contra manipulaciones. Finalmente, nos permite identificar y evitar la duplicaci\u00f3n de datos, simplificando las operaciones y reduciendo costos.<\/p>\n<h2><strong><b>\u00bfQu\u00e9 valor empresarial puede proporcionarnos el linaje de datos?<\/b><\/strong><\/h2>\n<p>Aunque el linaje de datos puede parecer un concepto abstracto, una comprensi\u00f3n integral de todo el ciclo de vida de los datos puede agregar valor al negocio en varias \u00e1reas:<\/p>\n<h3><strong><b>1. Mejorar el rendimiento empresarial<\/b><\/strong><\/h3>\n<p>Casi todas las decisiones en la empresa moderna dependen de la inteligencia empresarial (BI) y los sistemas de soporte de decisiones (DSS). Por ejemplo, qu\u00e9 caracter\u00edsticas deben priorizarse en el dise\u00f1o de nuevos productos, d\u00f3nde anunciarse y qu\u00e9 estrategias de ventas y marketing deben emplearse para maximizar los ingresos, la rentabilidad y la fidelizaci\u00f3n de los clientes. La frase &quot;si entra basura, sale basura&quot; se aplica a todos los aspectos del an\u00e1lisis. Los datos err\u00f3neos pueden distorsionar gravemente los resultados e influir gravemente en el rendimiento empresarial.<\/p>\n<h3><strong><b>2. Gestionar el cumplimiento normativo y el riesgo<\/b><\/strong><b><\/b><b><\/b><\/h3>\n<p><b><\/b>Las organizaciones de todos los sectores deben gestionar diversos requisitos regulatorios, y algunos solo afectan a ciertos sectores. Por ejemplo, la HIPAA, cuyo objetivo es proteger la informaci\u00f3n de los pacientes en el \u00e1mbito sanitario, y Basilea, cuyo objetivo es mitigar el riesgo en la banca internacional. Otros, como el Reglamento General de Protecci\u00f3n de Datos (RGPD) de la UE, influyen en todos los sectores. Disponer de metadatos que rastrean el linaje de los datos para fines de gobernanza de datos reduce el riesgo empresarial y los costes asociados al cumplimiento normativo, y tambi\u00e9n facilita y hace m\u00e1s rentable el cumplimiento de posibles nuevas regulaciones en el futuro.<\/p>\n<h3><strong><b>3. Gestionar fuentes de datos en constante evoluci\u00f3n<\/b><\/strong><\/h3>\n<p>Los sistemas y las fuentes de datos cambian con la evoluci\u00f3n de las condiciones comerciales. Por ejemplo, una aplicaci\u00f3n de an\u00e1lisis que estima el comportamiento del cliente simplemente analizando los datos tradicionales del punto de venta es casi seguro err\u00f3nea. Este enfoque anal\u00edtico no detectar\u00e1 clientes de pedidos de comercio electr\u00f3nico, compras dentro de la aplicaci\u00f3n y otros canales de venta y grupos demogr\u00e1ficos. Aunque esto pueda parecer obvio, el problema del sesgo de datos y las fuentes de datos no detectadas es un problema en el que incluso las organizaciones m\u00e1s complejas pueden caer f\u00e1cilmente.<\/p>\n<h3><strong><b>4. Reducir los costos y riesgos de TI<\/b><\/strong><\/h3>\n<p>Lo que todos los ejemplos anteriores tienen en com\u00fan es que se basan en tecnolog\u00edas de la informaci\u00f3n (TI). Las organizaciones que comprenden los conjuntos de datos y c\u00f3mo se utilizan pueden crear nuevas aplicaciones con mayor facilidad y resolver problemas con las aplicaciones existentes de forma m\u00e1s r\u00e1pida y econ\u00f3mica. Si la fuente de metadatos de los datos es clara, es mucho m\u00e1s f\u00e1cil y rentable modificar o a\u00f1adir una aplicaci\u00f3n de an\u00e1lisis.<\/p>\n<h2><strong><b>\u00bfC\u00f3mo gestionar el linaje de datos?<\/b><\/strong><\/h2>\n<p>La gesti\u00f3n del linaje de datos es especialmente importante en un entorno de data lake. Este contiene diferentes conjuntos de datos en distintos formatos provenientes de distintas fuentes, como im\u00e1genes, archivos de v\u00eddeo, archivos de registro, documentos, texto sin procesar o archivos en formato JSON, CSV, Apache Parquet u ORC (Optimized Row-Column). Adem\u00e1s, los conjuntos de datos se a\u00f1aden constantemente, a menudo con rapidez, y diversas herramientas pueden acceder y procesar los datos sin procesar para generar conjuntos de datos derivados adicionales.<\/p>\n<p>Cuando estos problemas de diversidad y velocidad se combinan con grandes vol\u00famenes de datos, resulta imposible rastrear manualmente el origen y los detalles de cada dato. La gesti\u00f3n de metadatos debe automatizarse en un entorno de data lake, y esto es especialmente importante al gestionar data lakes. A diferencia de los propios datos, que se almacenan en el data lake, los metadatos son \u00abdatos sobre datos\u00bb y pueden adoptar diversas formas.<\/p>\n<h2><strong><b>Conclusi\u00f3n<\/b><\/strong><\/h2>\n<p>Gracias por leer nuestro art\u00edculo y esperamos que pueda ayudarle a tener una mejor comprensi\u00f3n de<strong><b>\u00a0qu\u00e9<\/b><\/strong>\u00a0<strong><b>Linaje de datos y por qu\u00e9 es tan importante<\/b><\/strong>Si desea saber m\u00e1s sobre el linaje de datos, le recomendamos visitar <strong><a href=\"https:\/\/www.gudusoft.com\/es\/\">Flujo de SQL de Gudu<\/a><\/strong> Para m\u00e1s informaci\u00f3n. \u00a1Gracias de nuevo! <strong>\u00a0(Publicado por Ryan el 18 de abril de 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":3379,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[31,178],"tags":[55,56,54],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/3311"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/comments?post=3311"}],"version-history":[{"count":12,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/3311\/revisions"}],"predecessor-version":[{"id":4989,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/3311\/revisions\/4989"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media\/3379"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media?parent=3311"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/categories?post=3311"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/tags?post=3311"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}