{"id":4507,"date":"2022-06-20T22:27:47","date_gmt":"2022-06-21T06:27:47","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=4507"},"modified":"2022-09-17T14:28:48","modified_gmt":"2022-09-17T22:28:48","slug":"snowflake-data-governance","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/es\/gobernanza-de-datos-de-copos-de-nieve\/","title":{"rendered":"Gobernanza de datos de Snowflake: 3 aspectos importantes"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>Gobernanza de datos de Snowflake<\/h2>\n<p>Con el auge de las aplicaciones SaaS y la migraci\u00f3n del procesamiento de datos a la nube, la llegada de innumerables datos a un ritmo cada vez mayor exige decisiones empresariales en tiempo real. Ya sea que su organizaci\u00f3n decida migrar sus datos desde sus silos heredados o cargar una gran cantidad de datos sin procesar de distintas fuentes, probablemente ya haya considerado usar la nube. <a href=\"https:\/\/www.gudusoft.com\/es\/que-es-un-almacen-de-datos-2\/\"><strong>almac\u00e9n de datos<\/strong><\/a> como Snowflake para abordar estos dos problemas comunes <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-es-la-integridad-de-los-datos\/\">integraci\u00f3n de datos<\/a><\/strong> casos de uso.<\/p>\n<div id=\"attachment_4512\" style=\"width: 897px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-4512\" decoding=\"async\" class=\"size-full wp-image-4512\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Snowflake_Data_Governance.png\" alt=\"Gobernanza de datos de Snowflake\" width=\"887\" height=\"490\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Snowflake_Data_Governance-200x110.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Snowflake_Data_Governance-300x166.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Snowflake_Data_Governance-400x221.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Snowflake_Data_Governance-600x331.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Snowflake_Data_Governance-768x424.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Snowflake_Data_Governance-800x442.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Snowflake_Data_Governance.png 887w\" sizes=\"(max-width: 887px) 100vw, 887px\" \/><p id=\"caption-attachment-4512\" class=\"wp-caption-text\">Gobernanza de datos de Snowflake<\/p><\/div>\n<p>Sin embargo, el seguimiento de datos provenientes de tantas fuentes diferentes puede resultar dif\u00edcil. Garantizar la precisi\u00f3n e idoneidad de las fuentes de datos es la m\u00e1xima prioridad de una organizaci\u00f3n y, lo que es m\u00e1s importante, satisfacer las expectativas de autoservicio de todos los usuarios. Aqu\u00ed es donde <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-es-la-gobernanza-de-datos\/\">gobernanza de datos<\/a><\/strong> es el m\u00e1s influyente<\/p>\n<p>La gobernanza de datos implica la protecci\u00f3n y el control de datos, y permite que las personas de toda la organizaci\u00f3n compartan, procesen y socialicen la informaci\u00f3n significativa extra\u00edda de estos datos. Protege la integridad, la calidad y la credibilidad de los datos compartidos en toda la organizaci\u00f3n. Los beneficios se pueden multiplicar cuando se dise\u00f1a correctamente. <strong><a href=\"https:\/\/www.gudusoft.com\/es\/estrategia-de-gobernanza-de-datos\/\">estrategias de gobernanza de datos<\/a><\/strong> Se aplican a almacenes de datos basados en la nube.<\/p>\n<h3>Snowflake como almac\u00e9n de datos moderno<\/h3>\n<p>As a cloud data warehouse, Snowflake provides the performance, concurrency, and simplicity needed to store and analyze all of an organization&#8217;s data in one location. Snowflake provides a data repository for ingesting structured data for reporting and data analysis. Its ability to accept large amounts of unrefined data from a large number of sources in a variety of formats also makes IT an attractive data lake solution for many IT decision makers. Because of its ability to separate its storage from its computing resources, you can dynamically increase the storage capacity of the <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-es-un-lago-de-datos\/\">lago de datos<\/a><\/strong> sin tener en cuenta los nodos de c\u00f3mputo y ajustar de forma flexible el tama\u00f1o del cl\u00faster de c\u00f3mputo para satisfacer la demanda solo cuando sea necesario.<\/p>\n<h3>M\u00e1s all\u00e1 del almac\u00e9n y hacia el lago<\/h3>\n<p>Los data lakes pueden servir como alternativa al almacenamiento de conjuntos de datos dispares, y a veces limitados, en silos de datos dispersos y dispares. Deben proporcionar un sistema \u00fanico e integrado para almacenar y acceder f\u00e1cilmente a grandes cantidades de datos, a la vez que proporcionan acceso completo y directo a los datos organizacionales sin procesar (sin filtrar), donde los profesionales de inteligencia empresarial y muchos otros usuarios de la organizaci\u00f3n deber\u00edan tener acceso a los datos.<\/p>\n<p>El lago de datos construido sobre la base de un almac\u00e9n de datos moderno deber\u00eda tener las siguientes ventajas:<\/p>\n<ul>\n<li>Los datos sin procesar se pueden cargar, analizar y consultar inmediatamente sin necesidad de an\u00e1lisis previo. <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-es-la-transformacion-de-datos\/\">transformaci\u00f3n<\/a><\/strong>.<\/li>\n<li>Flujos de datos estructurados y semiestructurados sin codificaci\u00f3n manual ni intervenci\u00f3n manual.<\/li>\n<li>Administre consultas de esquema de tiempo de lectura y SQL nativo en datos estructurados y semiestructurados.<\/li>\n<li>Almacene de forma rentable grandes cantidades de datos sin procesar y utilice solo la potencia inform\u00e1tica necesaria.<\/li>\n<\/ul>\n<h3>La importancia de la gobernanza de datos<\/h3>\n<p>Para cualquier organizaci\u00f3n basada en datos que busque sacar el m\u00e1ximo provecho de sus datos para an\u00e1lisis e inteligencia empresarial, la gobernanza de datos debe ser una prioridad absoluta, y usar un almac\u00e9n de datos en la nube como Snowflake es la estrategia adecuada. Por ello, los l\u00edderes de TI que desean afrontar los retos de la transformaci\u00f3n digital, sin planificar una estrategia adecuada de gobernanza de datos, pueden cometer el error de sumergirse de lleno en sus lagos de datos ya establecidos, solo para encontrarse de nuevo en un pantano de datos.<\/p>\n<h3>Consequences of not Having Data Governance and <a href=\"https:\/\/www.gudusoft.com\/es\/como-mejorar-la-calidad-de-los-datos\/\">Calidad de los datos<\/a><\/h3>\n<p>Con la creciente cantidad de datos que fluyen a los lagos de datos a un ritmo cada vez mayor, las decisiones empresariales deben tomarse en tiempo real. Sin las medidas adecuadas, es casi imposible escalar la calidad de los datos, sea cual sea su tipo. Idealmente, los conjuntos de datos que entran en el lago de datos deber\u00edan enriquecerlo, pero, por desgracia, a veces lo contaminan.<\/p>\n<p>Como resultado, los equipos de TI pueden tardar semanas en publicar nuevas fuentes de datos que se pueden procesar en segundos. Peor a\u00fan, los clientes terminan creando su propia versi\u00f3n de la &quot;verdad&quot; a\u00f1adiendo sus propias reglas a la fuente de datos reci\u00e9n creada, cuando los consumidores de datos no se dan cuenta de que ya hay nuevos datos disponibles. En definitiva, se dedica o se desperdicia demasiado tiempo en preparar y proteger los datos, en lugar de analizarlos y proporcionar informaci\u00f3n empresarial valiosa.<\/p>\n<h3>De arriba hacia abajo y de abajo hacia arriba<\/h3>\n<p>Normalmente, la gobernanza de datos se aplica mediante un enfoque descendente al construir un almac\u00e9n de datos empresarial. Primero, se debe definir un modelo de datos central, lo que requiere la experiencia de un profesional de datos, como un <strong><a href=\"https:\/\/www.gudusoft.com\/es\/administradores-de-datos\/\">administrador de datos<\/a><\/strong>, <strong><a href=\"https:\/\/www.gudusoft.com\/es\/cientificos-de-datos\/\">cient\u00edfico de datos<\/a><\/strong>, responsable del tratamiento de datos, delegado de protecci\u00f3n de datos o <strong><a href=\"https:\/\/www.gudusoft.com\/es\/ingenieros-de-datos\/\">ingeniero de datos<\/a><\/strong>, para reconstruir los datos varias veces con fines sem\u00e1nticos antes de extraerlos para su an\u00e1lisis.<\/p>\n<p>Despu\u00e9s de la ingesti\u00f3n, la <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-es-el-catalogo-de-datos-por-que-los-datos-registro-de-datos\/\">cat\u00e1logo de datos<\/a><\/strong> Reconciliar\u00e1 el linaje y la accesibilidad. Si bien este enfoque es eficaz para la gesti\u00f3n centralizada de datos, este enfoque tradicional de gobernanza de datos no puede adaptarse a la era digital: muy pocas personas tienen acceso a los datos.<\/p>\n<p>Otro enfoque consiste en dise\u00f1ar la gobernanza de datos para el lago de datos mediante un enfoque ascendente. En comparaci\u00f3n con el modelo centralizado, este modelo m\u00e1s \u00e1gil ofrece varias ventajas. Por ejemplo, es escalable entre fuentes de datos, casos de uso y audiencias, y no requiere una estructura de archivos espec\u00edfica para la ingesta de datos. Mediante el uso de infraestructura en la nube y big data, este enfoque puede acelerar considerablemente el proceso de ingesta de datos sin procesar.<\/p>\n<p>Los lagos de datos suelen comenzar con un enfoque de laboratorio de datos donde solo los expertos en datos pueden acceder a los datos sin procesar. Posteriormente, se necesitar\u00e1n otras capas de gobernanza para conectar los datos con el contexto empresarial antes de que otros usuarios puedan usarlos. Una estrategia de gobernanza de datos como esta garantiza que el lago de datos ofrezca de forma consistente una \u00fanica fuente de informaci\u00f3n fiable para todos los usuarios.<\/p>\n<h3>Equilibrar los procesos colaborativos de gobernanza de datos<\/h3>\n<p>A medida que m\u00e1s personas de diferentes \u00e1reas de la organizaci\u00f3n incorporan cada vez m\u00e1s fuentes de datos, el lago de datos gobernado ideal contar\u00e1 con la estrategia de gobernanza de datos adecuada; establezca un enfoque m\u00e1s colaborativo desde el principio. Esto permite que los usuarios empresariales con m\u00e1s conocimientos se conviertan en proveedores y gestores de contenido. Para este enfoque, es fundamental trabajar con los datos en equipo desde el principio. De lo contrario, podr\u00eda verse abrumado por la cantidad de trabajo necesario para verificar la fiabilidad de los datos que se vierten en el lago de datos.<\/p>\n<h3>Entregamos datos confiables<\/h3>\n<p>Ahora entendemos por qu\u00e9 la gobernanza de datos es tan importante en la fase inicial de la migraci\u00f3n de datos a la nube y por qu\u00e9 implementar una estrategia colaborativa de gobernanza de datos es la \u00fanica soluci\u00f3n. Exploremos los pasos recomendados para aplicarla a un lago de datos en Snowflake.<\/p>\n<h4>Paso 1: Descubrir y limpiar<\/h4>\n<p>Utilice herramientas modernas de reconocimiento de patrones, creaci\u00f3n de perfiles de datos y calidad de datos para capturar y determinar qu\u00e9 se necesita para garantizar la calidad del conjunto de datos. Si aplica los datos tan pronto como entran en el entorno, podr\u00e1 comprender su contenido y hacerlos m\u00e1s significativos. La fase de descubrimiento y limpieza debe incluir las siguientes herramientas y capacidades:<\/p>\n<ul>\n<li>Perfilado automatizado mediante la catalogaci\u00f3n de datos. Sistematice el proceso aplic\u00e1ndolo autom\u00e1ticamente a cada conjunto de datos principal. Perfile autom\u00e1ticamente los datos, cree y categorice metadatos para facilitar el descubrimiento de datos.<\/li>\n<li>Preparaci\u00f3n de datos autoservicio. Permitiendo a cualquier persona acceder al conjunto de datos y, posteriormente, limpiarlos, normalizarlos, transformarlos o enriquecerlos.<\/li>\n<li>Las operaciones de calidad de datos comienzan con la fuente de datos y el ciclo de vida de los datos para garantizar que los datos confiables est\u00e9n finalmente disponibles para cualquier operador, usuario o aplicaci\u00f3n de datos.<\/li>\n<li>Omnipresencia mediante autoservicio. Ofrezca capacidades en todas las plataformas y aplicaciones, y distrib\u00fayalas a todos, desde desarrolladores hasta analistas de negocio.<\/li>\n<\/ul>\n<h4>Paso 2: Organizar y empoderar<\/h4>\n<p>La ventaja de centralizar datos confiables en un entorno compartible es que, una vez procesables, la organizaci\u00f3n ahorra tiempo y recursos. Esto se puede lograr de las siguientes maneras:<\/p>\n<ul>\n<li>Organice un cat\u00e1logo de datos y cree una fuente \u00fanica de datos confiables y protegidos que permita controlar los datos registrados y su linaje. Esta informaci\u00f3n debe incluir la procedencia de los datos, qui\u00e9n tuvo acceso a ellos y las relaciones entre los distintos conjuntos de datos. <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-son-los-datos-de-linaje-y-por-que-son-importantes\/\">Linaje de datos<\/a><\/strong> Le brindar\u00e1 una descripci\u00f3n general del seguimiento del flujo de datos desde la fuente de datos hasta el destino final, as\u00ed como el cumplimiento de las regulaciones de privacidad como GDPR o CCPA.<\/li>\n<li>Capacite a las personas para gestionar, remediar y proteger los datos. Las funciones administrativas cuentan con el respaldo para designar administradores de datos que los mantengan y faciliten su b\u00fasqueda y uso. Deje la preparaci\u00f3n en manos de quienes pueden identificarlos con precisi\u00f3n, y los datos confidenciales en manos de quienes deben consultarlos.<\/li>\n<li>Involucre a sus colegas en la mejora de los datos. Mediante capacidades de gesti\u00f3n colaborativa de datos, como la administraci\u00f3n de datos, puede crear flujos de trabajo coordinados y actividades de gesti\u00f3n que involucren a todos en la calidad de los datos.<\/li>\n<\/ul>\n<h4>Paso 3: Automatizar y habilitar<\/h4>\n<p>Una vez que todos los datos descubiertos y depurados est\u00e9n organizados centralmente y las partes interesadas clave se hayan involucrado en la gesti\u00f3n colaborativa de los datos para garantizar su fiabilidad y cumplimiento normativo, es hora de implementar la fase de automatizaci\u00f3n. Automatizar el procesamiento de datos es esencial no solo para mantener flujos de trabajo escalables, sino tambi\u00e9n para eliminar tareas manuales repetitivas, tediosas y contraproducentes.<\/p>\n<ul>\n<li>Utilice el aprendizaje autom\u00e1tico para aprender de la remediaci\u00f3n y la deduplicaci\u00f3n para sugerir la siguiente mejor acci\u00f3n para aplicar al flujo de datos, o para tomar el conocimiento impl\u00edcito de los usuarios y ejecutarlo a gran escala a trav\u00e9s de la automatizaci\u00f3n.<\/li>\n<li>Utilice o encripte la protecci\u00f3n autom\u00e1tica. Comparta datos de forma selectiva dentro de su organizaci\u00f3n para fines de desarrollo, an\u00e1lisis, etc., sin revelar informaci\u00f3n personal identificable a personas no autorizadas a verla.<\/li>\n<li>Habilitar a todos. Construir una plataforma para todos, aprovechando aplicaciones intuitivas para una comunidad de interesados.<\/li>\n<li>Utilice los servicios API para extraer conjuntos de datos valiosos de su data lake y reintroducirlos en sus aplicaciones empresariales. Canalice sus datos a aplicaciones que se benefician de los datos confiables generados por sus iniciativas de gobernanza de datos y aporten inteligencia valiosa a sus aplicaciones empresariales.<\/li>\n<\/ul>\n<p>Inevitablemente, a medida que m\u00e1s organizaciones implementan sus estrategias de transformaci\u00f3n digital y migran a la integraci\u00f3n de datos en la nube, se interesar\u00e1n cada vez m\u00e1s por la gobernanza de datos. Como mencionamos, Snowflake ofrece una soluci\u00f3n moderna de almacenamiento de datos en la nube donde se puede construir un lago de datos para cualquier proyecto, desde migraciones de big data hasta proyectos de big data, independientemente del formato u origen. Esto supone una gran ventaja, ya que permite cargar y acceder a todos los datos desde una \u00fanica fuente de informaci\u00f3n.<\/p>\n<p><span class=\"Y2IQFc\" lang=\"en\">Dicho esto, no hay garant\u00eda de que la informaci\u00f3n proporcionada en un lago de datos sea fiable a menos que se implemente una estrategia s\u00f3lida de gobernanza de datos. La gobernanza de datos solo se puede lograr mediante un descubrimiento y una limpieza adecuados, la gesti\u00f3n responsable, la calidad y el autoservicio.<\/span><\/p>\n<h3>Conclusi\u00f3n<\/h3>\n<p>Gracias por leer nuestro art\u00edculo. Esperamos que le ayude a comprender mejor la gobernanza de datos de Snowflake. Si desea obtener m\u00e1s informaci\u00f3n sobre la gobernanza de datos de Snowflake, le recomendamos visitar <strong><a href=\"https:\/\/www.gudusoft.com\/es\/\">Flujo de SQL de Gudu<\/a><\/strong> Para m\u00e1s informaci\u00f3n.<\/p>\n<p>Como uno de los\u00a0<strong><a href=\"https:\/\/www.dpriver.com\/blog\/2022\/05\/11\/best-data-lineage-tools\/\" target=\"_blank\" rel=\"noopener noreferrer\">Las mejores herramientas de linaje de datos<\/a><\/strong> Disponible actualmente en el mercado, Gudu SQLFlow no solo puede analizar archivos de script SQL, obtener linaje de datos y realizar una visualizaci\u00f3n, sino que tambi\u00e9n permite a los usuarios proporcionar linaje de datos en formato CSV y realizar una visualizaci\u00f3n.\u00a0<strong>(Publicado por Ryan el 21 de junio de 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":4539,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[178],"tags":[137,181,154,157,75,186],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/4507"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/comments?post=4507"}],"version-history":[{"count":32,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/4507\/revisions"}],"predecessor-version":[{"id":6009,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/4507\/revisions\/6009"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media\/4539"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media?parent=4507"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/categories?post=4507"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/tags?post=4507"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}