{"id":5700,"date":"2022-08-29T06:08:31","date_gmt":"2022-08-29T14:08:31","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=5700"},"modified":"2022-08-29T06:09:46","modified_gmt":"2022-08-29T14:09:46","slug":"everything-you-need-to-know-about-data-lineage","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/es\/todo-lo-que-necesitas-saber-sobre-el-linaje-de-datos\/","title":{"rendered":"Todo lo que necesita saber sobre el linaje de datos"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>Todo lo que necesita saber sobre el linaje de datos<\/h2>\n<p>Qu\u00e9 es <a href=\"https:\/\/www.gudusoft.com\/es\/software-de-linaje-de-datos-que-es-y-por-que-lo-necesito\/\"><strong>linaje de datos<\/strong><\/a>\u00bfCu\u00e1les son las caracter\u00edsticas del linaje de datos? \u00bfCu\u00e1les son sus usos? \u00bfCu\u00e1les son los m\u00e9todos de recopilaci\u00f3n de linaje de datos? Si busca respuestas a estas preguntas, ha llegado al lugar indicado. En este art\u00edculo, profundizaremos en... <strong>Todo lo que necesitas saber sobre el linaje de datos<\/strong>.<\/p>\n<div id=\"attachment_5704\" style=\"width: 827px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-5704\" decoding=\"async\" class=\"size-full wp-image-5704\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage.png\" alt=\"Todo lo que necesita saber sobre el linaje de datos\" width=\"817\" height=\"506\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage-18x12.png 18w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage-200x124.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage-300x186.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage-400x248.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage-600x372.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage-768x476.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage-800x495.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Everything_You_Need_to_Know_About_Data_Lineage.png 817w\" sizes=\"(max-width: 817px) 100vw, 817px\" \/><p id=\"caption-attachment-5704\" class=\"wp-caption-text\">Todo lo que necesita saber sobre el linaje de datos<\/p><\/div>\n<p><strong>Todo lo que necesita saber sobre el linaje de datos: \u00bfQu\u00e9 es el linaje de datos?<\/strong><\/p>\n<p>En todo el proceso de generaci\u00f3n, procesamiento e integraci\u00f3n de datos, circulaci\u00f3n y desaparici\u00f3n final, se formar\u00e1 naturalmente una relaci\u00f3n entre ellos. Esta relaci\u00f3n se expresa recurriendo a una relaci\u00f3n similar en la sociedad humana, denominada relaci\u00f3n de linaje de datos. El linaje de datos es uno de los componentes de... <a href=\"https:\/\/www.gudusoft.com\/es\/que-son-los-metadatos\/\"><strong>metadatos<\/strong><\/a>.<\/p>\n<p>Permite analizar la ruta de linaje de la tabla y los campos desde la fuente de datos hasta la tabla actual, si se cumple la relaci\u00f3n entre los campos de linaje, la consistencia de los datos en cuesti\u00f3n y la racionalidad del dise\u00f1o de la tabla. Permite analizar el impacto de los cambios en los datos ascendentes en los descendentes y rastrear el origen de los problemas ascendentes cuando se producen cambios en los datos descendentes.<\/p>\n<p><strong> Todo lo que necesita saber sobre el linaje de datos: las caracter\u00edsticas del linaje de datos<\/strong><\/p>\n<ol>\n<li>Atribuci\u00f3n: en t\u00e9rminos generales, datos espec\u00edficos pertenecen a una organizaci\u00f3n o individuo espec\u00edfico, y los datos tienen atribuci\u00f3n.<\/li>\n<li>Multifuente: Los mismos datos pueden provenir de m\u00faltiples fuentes. Un dato puede generarse procesando varios datos, y este proceso puede ser m\u00faltiple.<\/li>\n<li>Trazabilidad: La relaci\u00f3n de linaje de datos refleja el ciclo de vida de los datos y refleja todo el proceso de los datos desde su generaci\u00f3n hasta su desaparici\u00f3n, con trazabilidad.<\/li>\n<li>Jer\u00e1rquico: Las relaciones de linaje de datos son jer\u00e1rquicas. La informaci\u00f3n de descripci\u00f3n de los datos, como su clasificaci\u00f3n, inducci\u00f3n y resumen, forma nuevos datos, y la informaci\u00f3n de descripci\u00f3n de diferentes grados forma el nivel de los datos.<\/li>\n<\/ol>\n<p><strong> Todo lo que necesita saber sobre el linaje de datos: sus usos<\/strong><\/p>\n<ol>\n<li>Trazabilidad de Datos: La relaci\u00f3n de linaje de datos refleja los detalles de los datos, lo que nos permite rastrear su origen y el proceso de procesamiento. Cuando los datos presentan anomal\u00edas, es necesario rastrear su causa y controlar el riesgo a un nivel adecuado. Especialmente con el desarrollo de las empresas, la diversidad de fuentes de datos y diferentes niveles de calidad influyen inevitablemente en los resultados de los datos. Por lo tanto, la trazabilidad de datos es fundamental.<\/li>\n<li>An\u00e1lisis de impacto: Con el aumento de las aplicaciones de datos, la cadena de flujo de datos se alarga cada vez m\u00e1s. Para los cambios en la actividad principal de una fuente, las aplicaciones de an\u00e1lisis posteriores deben mantenerse sincronizadas. Sin an\u00e1lisis de impacto, se producir\u00e1n accesos anormales a cada servicio de datos. Este suele ser un requisito fundamental del sector del desarrollo para facilitar las evaluaciones de impacto.<\/li>\n<li>El valor de los datos: Medir el valor de los datos es un problema muy complejo. Para evaluarlo, se necesita una base. El linaje de datos proporciona datos de referencia en varios aspectos para facilitar la evaluaci\u00f3n. <strong>Audiencia de datos<\/strong>Cuanto m\u00e1s demandantes de datos, mayor ser\u00e1 el valor de los datos.<br \/>\n<strong>Magnitud de la actualizaci\u00f3n<\/strong>:Cuanto mayor sea la cantidad de datos actualizados, mayor ser\u00e1 el valor de los datos.<br \/>\n<strong>Frecuencia de actualizaci\u00f3n<\/strong>:Cuanto m\u00e1s frecuente sea la actualizaci\u00f3n, mayor ser\u00e1 el valor de los datos.<\/li>\n<li>Evaluaci\u00f3n de Calidad: Es el requisito de <a href=\"https:\/\/www.gudusoft.com\/es\/como-elegir-una-herramienta-de-analisis-de-datos\/\"><strong>an\u00e1lisis de datos<\/strong><\/a> Aplicaciones, y es necesario controlar la calidad de los datos finales. Cuando se detectan problemas en los datos, es necesario rastrear la fuente de datos, analizar las causas de los problemas de calidad y resolverlos. A partir del diagrama de linaje de datos, se puede obtener f\u00e1cilmente el proceso de procesamiento de datos y, posteriormente, analizar los posibles problemas de calidad.<\/li>\n<li>El ciclo de vida: A trav\u00e9s del linaje de datos, se puede obtener intuitivamente el ciclo de vida completo de los datos. Para datos menos valiosos, considere la organizaci\u00f3n en niveles, el archivado o incluso la destrucci\u00f3n.<\/li>\n<li>Requisitos de Cumplimiento: Esta suele ser una necesidad de la alta direcci\u00f3n. Para el cumplimiento normativo, todos los puntos y fuentes del flujo de datos son clave para su regulaci\u00f3n. Por lo tanto, se requiere una comprensi\u00f3n integral de la relaci\u00f3n entre los datos.<\/li>\n<li>Control de Seguridad: Esta suele ser una necesidad de cumplimiento de seguridad: comprender c\u00f3mo se utilizan los datos y a qui\u00e9n va dirigido. Todos estos datos est\u00e1n disponibles en el linaje de datos. Estos tambi\u00e9n sentar\u00e1n las bases para la gesti\u00f3n de permisos (autorizaci\u00f3n a nivel de tabla y de campo), garantizando as\u00ed la seguridad de los datos a un nivel superior. En combinaci\u00f3n con los identificadores de seguridad en los metadatos (por ejemplo, qu\u00e9 datos deben desensibilizarse, etc.), se puede gestionar y controlar la seguridad de todo el dominio.<\/li>\n<li>Dise\u00f1o de la arquitectura: El linaje de datos permite comprender los datos desde la perspectiva del procesamiento de datos. En algunos casos, esto es perfectamente l\u00f3gico. Por ejemplo, cuando se finaliza un proyecto antiguo y se requiere un nuevo proyecto para retomarlo, sin una tabla de mapeo del flujo de datos, la organizaci\u00f3n tomar\u00e1 mucho tiempo y ser\u00e1 dif\u00edcil garantizar la integridad y la correcci\u00f3n de la migraci\u00f3n.<\/li>\n<li>Activos de datos: Para la gesti\u00f3n de la empresa, el flujo general de datos puede comprenderse mediante el linaje de datos. Esto resulta de gran utilidad para la formulaci\u00f3n de la estrategia de activos de datos de la empresa.<\/li>\n<li>Necesidades de I+D: Para el personal de I+D de datos, si hay linaje de datos, es conveniente encontrar y comprender la l\u00f3gica de procesamiento de datos y solucionar problemas.<\/li>\n<\/ol>\n<p><strong> Todo lo que necesita saber sobre el linaje de datos: los m\u00e9todos de recopilaci\u00f3n de linaje de datos<\/strong><\/p>\n<ol>\n<li>An\u00e1lisis Autom\u00e1tico: El an\u00e1lisis autom\u00e1tico es actualmente el principal m\u00e9todo de recopilaci\u00f3n. Este m\u00e9todo espec\u00edfico consiste en analizar sentencias SQL, procedimientos almacenados, procedimientos ETL y otros archivos. Debido a la complejidad del c\u00f3digo y del entorno de aplicaci\u00f3n, entre otras razones, seg\u00fan la experiencia de fabricantes internacionales, el an\u00e1lisis autom\u00e1tico puede abarcar entre 70 y 951 TP2T de datos empresariales, pero actualmente es imposible alcanzar 1001 TP2T.<\/li>\n<li>Seguimiento del sistema: Es decir, durante el flujo de procesamiento de datos, el programa de procesamiento se encarga de enviar la informaci\u00f3n de linaje. Por ejemplo, en la secci\u00f3n de anotaciones, se puede a\u00f1adir una descripci\u00f3n del linaje, etc. La ventaja de este enfoque es que la recopilaci\u00f3n es precisa, oportuna y ofrece un soporte detallado; sin embargo, la desventaja es que resulta intrusivo. Sin embargo, si la empresa adopta una plataforma de procesamiento unificada, este m\u00e9todo es muy recomendable.<\/li>\n<li>Aprendizaje autom\u00e1tico: Este m\u00e9todo calcula la similitud de los datos bas\u00e1ndose en las dependencias entre conjuntos de datos. La ventaja de este m\u00e9todo es que no depende de herramientas ni del negocio, y la desventaja es que la precisi\u00f3n debe confirmarse manualmente.<\/li>\n<li>Recopilaci\u00f3n manual: El \u00faltimo es el m\u00e9todo \u201cuniversal\u201d, que consiste en organizar el linaje de datos manualmente por parte de I+D.<\/li>\n<\/ol>\n<p><strong>Todo lo que necesita saber sobre el linaje de datos: la aplicaci\u00f3n del linaje de datos<\/strong><\/p>\n<p>Seg\u00fan la capacidad del linaje de datos, se utilizan com\u00fanmente las siguientes aplicaciones:<\/p>\n<ol>\n<li>Al especificar una tabla\/campo, para rastrear su objeto multinivel hacia adelante.<\/li>\n<li>Al especificar la tabla\/campo, para asociar su objeto multinivel hacia atr\u00e1s.<\/li>\n<li>Al no limitarse a un solo objeto, se puede comprender el flujo de datos general a mayor escala (por ejemplo, dentro de un proyecto, etc.). Esto resulta \u00fatil para el an\u00e1lisis de objetos clave, la limpieza de datos, etc.<\/li>\n<li>Es decir, desde la perspectiva de las operaciones, analizar sus operaciones de avance y retroceso. Esto es \u00fatil para la resoluci\u00f3n de problemas, el an\u00e1lisis de calidad y m\u00e1s.<\/li>\n<li>Adem\u00e1s de nuestro concepto habitual de linaje, existe un linaje m\u00e1s generalizado. No solo existe una relaci\u00f3n a nivel de datos entre objetos, sino tambi\u00e9n una relaci\u00f3n a nivel de referencia, es decir, el uso asociado entre objetos, incluyendo, entre otros, tablas, vistas, modelos, informes, trabajos, etc. Esto es relevante para la evaluaci\u00f3n del valor de los datos, la gesti\u00f3n de activos de datos, etc.<\/li>\n<li>La exploraci\u00f3n de datos tradicional suele realizarse seg\u00fan la definici\u00f3n de la jerarqu\u00eda de datos. Cuando existe linaje de datos, se ofrece otro m\u00e9todo de exploraci\u00f3n, es decir, una exploraci\u00f3n paso a paso seg\u00fan la l\u00f3gica de procesamiento de datos.<\/li>\n<\/ol>\n<h3>Conclusi\u00f3n<\/h3>\n<p>Gracias por leer nuestro art\u00edculo y esperamos que le sea \u00fatil. Si desea obtener m\u00e1s informaci\u00f3n sobre el linaje de datos, le recomendamos visitar <a href=\"https:\/\/sqlflow.gudusoft.com\/#\/\" rel=\"dofollow\"><strong>Flujo de SQL de Gudu<\/strong><\/a> Para m\u00e1s informaci\u00f3n.<\/p>\n<p>Como uno de los <a href=\"https:\/\/www.dpriver.com\/blog\/2022\/05\/11\/best-data-lineage-tools\/\" rel=\"dofollow\"><strong>Las mejores herramientas de linaje de datos<\/strong><\/a> Disponible actualmente en el mercado, Gudu SQLFlow no solo puede analizar archivos de script SQL, obtener linaje de datos y realizar una visualizaci\u00f3n, sino que tambi\u00e9n permite a los usuarios proporcionar linaje de datos en formato CSV y realizar una visualizaci\u00f3n.<strong>Publicado por Ryan el 29 de agosto de 2022<\/strong>)<\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":5713,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[178,179],"tags":[55,379,376,378,377,375],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/5700"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/comments?post=5700"}],"version-history":[{"count":14,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/5700\/revisions"}],"predecessor-version":[{"id":5733,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/5700\/revisions\/5733"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media\/5713"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media?parent=5700"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/categories?post=5700"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/tags?post=5700"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}