{"id":4147,"date":"2022-05-29T23:28:51","date_gmt":"2022-05-30T07:28:51","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=4147"},"modified":"2022-09-17T14:34:59","modified_gmt":"2022-09-17T22:34:59","slug":"what-is-a-data-lake","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/es\/que-es-un-lago-de-datos\/","title":{"rendered":"\u00bfQu\u00e9 es un lago de datos? | Introducci\u00f3n a los lagos de datos"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>Lago de datos 101<\/h2>\n<p>El lago de datos es un concepto de gran actualidad, y muchas empresas est\u00e1n construyendo o planeando construir sus propios lagos de datos. Sin embargo, antes de planificar y construir un lago de datos, es importante aclarar qu\u00e9 es, por qu\u00e9 lo necesitamos, cu\u00e1l es su valor y cu\u00e1les son sus escenarios de aplicaci\u00f3n. En este art\u00edculo, intentaremos responder a estas preguntas para que pueda comprenderlo mejor.<\/p>\n<div id=\"attachment_4152\" style=\"width: 1003px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-4152\" decoding=\"async\" class=\"size-full wp-image-4152\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake.png\" alt=\"\u00bfQu\u00e9 es un lago de datos? \" width=\"993\" height=\"569\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake-200x115.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake-300x172.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake-400x229.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake-600x344.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake-768x440.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake-800x458.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake.png 993w\" sizes=\"(max-width: 993px) 100vw, 993px\" \/><p id=\"caption-attachment-4152\" class=\"wp-caption-text\">\u00bfQu\u00e9 es un lago de datos?<\/p><\/div>\n<h2>\u00bfQu\u00e9 es un lago de datos?<\/h2>\n<p>Un lago de datos es un repositorio centralizado para almacenar, procesar y proteger grandes vol\u00famenes de datos estructurados, semiestructurados y no estructurados. Puede almacenar datos en su formato nativo y gestionar cualquier formato de conversi\u00f3n, independientemente de las limitaciones de tama\u00f1o.<\/p>\n<p>Proporciona una plataforma escalable y segura que permite a las empresas ingerir cualquier dato de cualquier sistema, a cualquier velocidad, desde sistemas inform\u00e1ticos locales, en la nube o de borde, almacenar cualquier tipo o cantidad de datos con total fidelidad, procesar datos en tiempo real o por lotes y analizar datos utilizando SQL, Python, R o cualquier otro lenguaje, datos de terceros o aplicaci\u00f3n de an\u00e1lisis.<\/p>\n<h2>\u00bfPor qu\u00e9 lo necesitamos?<\/h2>\n<p>Las organizaciones que generen valor comercial a partir de los datos superar\u00e1n a sus competidores. Una encuesta de Aberdeen muestra que las organizaciones que implementan lagos de datos superan a empresas comparables en crecimiento org\u00e1nico de ingresos en un 91% (TP2T). Estos l\u00edderes habilitan nuevos tipos de an\u00e1lisis, como el aprendizaje autom\u00e1tico a partir de nuevas fuentes como archivos de registro, datos de flujos de clics, redes sociales y dispositivos conectados a internet almacenados en lagos de datos. Esto les ayuda a identificar y responder a las oportunidades de crecimiento empresarial con mayor rapidez, atrayendo y fidelizando clientes, aumentando la productividad, manteniendo proactivamente los equipos y tomando decisiones informadas.<\/p>\n<h2>\u00bfCual es su valor?<\/h2>\n<p>Por un lado, permite integrar diferentes tipos de datos. Por otro lado, su valor reside en que el an\u00e1lisis de datos puede realizarse sin un modelo predefinido. Las arquitecturas de big data actuales son escalables y ofrecen a los usuarios cada vez m\u00e1s an\u00e1lisis en tiempo real. Hoy, antes de que se eliminen la inteligencia empresarial (BI) y los almacenes de datos, el an\u00e1lisis de big data y los lagos de big data est\u00e1n evolucionando hacia m\u00e1s servicios inteligentes en tiempo real que facilitan la toma de decisiones en tiempo real.<\/p>\n<h2>\u00bfC\u00f3mo beneficia a las empresas?<\/h2>\n<p><strong>Primero<\/strong>Cuenta con funciones m\u00e1s potentes para la extracci\u00f3n de valor de los datos. En la implementaci\u00f3n de procesos de autorizaci\u00f3n y auditor\u00eda detallados, como el an\u00e1lisis de datos, el aprendizaje autom\u00e1tico, el acceso y la gesti\u00f3n de datos, el valor de los lagos de datos es m\u00e1s incisivo.<\/p>\n<p><strong>Segundo,<\/strong> Se elimina el fen\u00f3meno de los silos de datos. No hay restricciones en el tipo de formato de datos, y todos los datos pueden fluir al lago de datos. Una vez generados los datos del usuario, estos se almacenan directamente en el lago de datos seg\u00fan su contenido y atributos originales, sin necesidad de procesarlos ni estructurarlos antes de que fluyan al lago de datos.<\/p>\n<p>El <strong>tercero<\/strong> Su objetivo es satisfacer la expansi\u00f3n el\u00e1stica del almacenamiento de datos a gran escala de los usuarios. Admite tipos de datos complejos para los usuarios actuales, incluyendo datos estructurados como tablas en bases de datos relacionales, datos semiestructurados como CSV, JSON, XML, registros, etc., y datos no estructurados como correos electr\u00f3nicos, documentos, PDF, gr\u00e1ficos, audio, v\u00eddeo, etc. Los lagos de datos permiten implementar almacenamiento a gran escala a nivel de PB y EB.<\/p>\n<p><strong>Cuatro<\/strong>Se logra la separaci\u00f3n de la computaci\u00f3n y el almacenamiento. En vista de la direcci\u00f3n general del futuro reconocida por la industria, la arquitectura de separaci\u00f3n de almacenamiento y computaci\u00f3n proporciona escalabilidad independiente, lo que permite que los motores de computaci\u00f3n se expandan seg\u00fan sea necesario mientras los datos fluyen hacia el lago de datos. M\u00e1s importante a\u00fan, el modo desacoplado de almacenamiento y computaci\u00f3n ofrece una mejor relaci\u00f3n calidad-precio. Cabe destacar que la separaci\u00f3n de la computaci\u00f3n y el almacenamiento en el lago de datos no significa que el motor de procesamiento y an\u00e1lisis de datos y el disco se encuentren en hosts diferentes, sino que separa el almacenamiento del contenido de datos del motor de procesamiento y an\u00e1lisis de datos.<\/p>\n<h2>\u00bfC\u00f3mo determinar si necesitas un lago de datos?<\/h2>\n<p>Al determinar si su empresa necesita un lago de datos, debe considerar el tipo de datos con los que est\u00e1 tratando, lo que desea hacer con esos datos, la complejidad de su proceso de adquisici\u00f3n de datos, su gesti\u00f3n de datos y <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-es-la-gobernanza-de-datos\/\">gobernanza de datos<\/a><\/strong> estrategias, as\u00ed como las herramientas y niveles de habilidades que utilizan las personas de su organizaci\u00f3n.<\/p>\n<p>Hoy en d\u00eda, las empresas est\u00e1n empezando a considerar el valor de los data lakes desde una perspectiva diferente. Es decir, no solo se utilizan para almacenar datos de alta fidelidad, sino que tambi\u00e9n pueden ayudar a los usuarios a comprender mejor las condiciones del negocio. Dado que los data lakes proporcionan un contexto m\u00e1s completo que nunca, esto ayuda a agilizar los experimentos anal\u00edticos.<\/p>\n<p>Los lagos de datos se desarrollan principalmente para procesar grandes vol\u00famenes de big data, y las empresas a menudo pueden transferir datos sin procesar a un lago de datos mediante lotes o streaming sin necesidad de transformarlos. Las empresas dependen de ellos principalmente para los siguientes fines:<\/p>\n<ul>\n<li>Menor costo total de propiedad;<\/li>\n<li>Simplificar la gesti\u00f3n de datos;<\/li>\n<li>Est\u00e9 preparado para incorporar inteligencia artificial y aprendizaje autom\u00e1tico;<\/li>\n<li>Acelerar el an\u00e1lisis;<\/li>\n<li>Mejorar la seguridad y la gobernanza.<\/li>\n<\/ul>\n<h2>\u00bfCu\u00e1les son sus escenarios de uso?<\/h2>\n<p>Debido a que el lago de datos proporciona la base para el an\u00e1lisis y la inteligencia artificial, las empresas de todas las industrias lo est\u00e1n utilizando para aumentar los ingresos, ahorrar dinero y reducir el riesgo.<\/p>\n<ol>\n<li><strong>Medios y entretenimiento: <\/strong>Las empresas que ofrecen streaming online de m\u00fasica, radio y podcasts pueden aumentar sus ingresos mejorando sus sistemas de recomendaci\u00f3n para que los usuarios consuman m\u00e1s de sus servicios, permitiendo a las empresas vender m\u00e1s anuncios.<\/li>\n<li><strong>Telecomunicaciones:<\/strong> Las empresas multinacionales de telecomunicaciones pueden ahorrar dinero mediante la creaci\u00f3n de modelos de propensi\u00f3n a la p\u00e9rdida de clientes para reducirla.<\/li>\n<li><strong>Servicios financieros:<\/strong> Las empresas de inversi\u00f3n pueden confiar en los lagos de datos para impulsar el aprendizaje autom\u00e1tico y as\u00ed poder gestionar el riesgo de la cartera tan pronto como los datos del mercado en tiempo real est\u00e9n disponibles.<\/li>\n<\/ol>\n<h2>Conclusi\u00f3n<\/h2>\n<p>Gracias por leer nuestro art\u00edculo. Esperamos que le ayude a comprender mejor qu\u00e9 es un lago de datos. Si desea obtener m\u00e1s informaci\u00f3n, le recomendamos visitar <strong><a href=\"https:\/\/www.gudusoft.com\/es\/\">Flujo de SQL de Gudu<\/a><\/strong> Para m\u00e1s informaci\u00f3n.<\/p>\n<p>Como uno de los <strong><a href=\"https:\/\/www.dpriver.com\/blog\/2022\/05\/11\/best-data-lineage-tools\/\">Las mejores herramientas de linaje de datos<\/a><\/strong> Disponible actualmente en el mercado, Gudu SQLFlow no solo puede analizar archivos de script SQL, obtener el linaje de datos y realizar visualizaciones, sino que tambi\u00e9n permite a los usuarios proporcionar <strong><a href=\"https:\/\/www.gudusoft.com\/es\/base-de-conocimiento-de-linaje-de-datos\/\">linaje de datos<\/a><\/strong> en formato CSV y realizar visualizaci\u00f3n. <strong>(Publicado por Ryan el 29 de mayo de 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":4191,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[31,178],"tags":[137,154,155,75,156],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/4147"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/comments?post=4147"}],"version-history":[{"count":45,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/4147\/revisions"}],"predecessor-version":[{"id":4195,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/4147\/revisions\/4195"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media\/4191"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media?parent=4147"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/categories?post=4147"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/tags?post=4147"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}