{"id":4147,"date":"2022-05-29T23:28:51","date_gmt":"2022-05-30T07:28:51","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=4147"},"modified":"2022-09-17T14:34:59","modified_gmt":"2022-09-17T22:34:59","slug":"what-is-a-data-lake","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/pt\/o-que-e-um-data-lake\/","title":{"rendered":"O que \u00e9 um Data Lake? | Data Lake 101"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>Lago de Dados 101<\/h2>\n<p>O data lake \u00e9 um conceito quente no momento, e muitas empresas est\u00e3o construindo ou planejando construir seus pr\u00f3prios data lakes. No entanto, antes de planejar e construir um data lake, voc\u00ea deve esclarecer o que \u00e9 um data lake, por que precisamos dele, qual \u00e9 seu valor e quais s\u00e3o seus cen\u00e1rios de aplica\u00e7\u00e3o. Neste artigo, tentaremos responder a essas perguntas para que voc\u00ea possa entend\u00ea-lo melhor.<\/p>\n<div id=\"attachment_4152\" style=\"width: 1003px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-4152\" decoding=\"async\" class=\"size-full wp-image-4152\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake.png\" alt=\"O que \u00e9 um Data Lake? \" width=\"993\" height=\"569\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake-200x115.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake-300x172.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake-400x229.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake-600x344.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake-768x440.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake-800x458.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/What_Is_a_Data_Lake.png 993w\" sizes=\"(max-width: 993px) 100vw, 993px\" \/><p id=\"caption-attachment-4152\" class=\"wp-caption-text\">O que \u00e9 um Data Lake?<\/p><\/div>\n<h2>O que \u00e9 um data lake?<\/h2>\n<p>Um data lake \u00e9 um reposit\u00f3rio centralizado para armazenar, processar e proteger grandes volumes de dados estruturados, semiestruturados e n\u00e3o estruturados. Ele pode armazenar dados em seu formato nativo e lidar com qualquer formato de convers\u00e3o, independentemente das limita\u00e7\u00f5es de tamanho.<\/p>\n<p>Ele fornece uma plataforma escal\u00e1vel e segura que permite \u00e0s empresas ingerir quaisquer dados de qualquer sistema, em qualquer velocidade, de sistemas locais, em nuvem ou de computa\u00e7\u00e3o de ponta, armazenar qualquer tipo ou quantidade de dados com total fidelidade, processar dados em tempo real ou em lote e analisar dados usando SQL, Python, R ou qualquer outra linguagem, dados de terceiros ou aplicativo de an\u00e1lise.<\/p>\n<h2>Por que precisamos disso?<\/h2>\n<p>As organiza\u00e7\u00f5es que criam valor comercial com sucesso a partir de dados superar\u00e3o seus pares. Uma pesquisa da Aberdeen mostra que as organiza\u00e7\u00f5es que implementam data lakes superam empresas compar\u00e1veis em crescimento org\u00e2nico de receita em 9%. Esses l\u00edderes permitem novos tipos de an\u00e1lises, como aprendizado de m\u00e1quina de novas fontes, como arquivos de log, dados de fluxos de cliques, m\u00eddia social e dispositivos conectados \u00e0 Internet armazenados em data lakes. Isso os ajuda a identificar e responder a oportunidades de crescimento de neg\u00f3cios mais rapidamente, atraindo e retendo clientes, aumentando a produtividade, mantendo equipamentos proativamente e tomando decis\u00f5es informadas.<\/p>\n<h2>Qual \u00e9 o seu valor?<\/h2>\n<p>Por um lado, ele pode reunir diferentes tipos de dados. Por outro lado, seu valor \u00e9 que a an\u00e1lise de dados pode ser realizada sem um modelo predefinido. As arquiteturas de big data de hoje s\u00e3o escal\u00e1veis e podem fornecer aos usu\u00e1rios cada vez mais an\u00e1lises em tempo real. Hoje, antes que a intelig\u00eancia empresarial (BI) e os data warehouses sejam eliminados, as an\u00e1lises de big data e os big data lakes est\u00e3o se desenvolvendo em dire\u00e7\u00e3o a mais tipos de servi\u00e7os inteligentes em tempo real que podem dar suporte \u00e0 tomada de decis\u00f5es em tempo real.<\/p>\n<h2>Como isso beneficia as empresas?<\/h2>\n<p><strong>Primeiro<\/strong>, ele tem fun\u00e7\u00f5es mais poderosas para minera\u00e7\u00e3o de valor de dados. Na realiza\u00e7\u00e3o de autoriza\u00e7\u00e3o e auditoria de granularidade fina, como an\u00e1lise de dados, aprendizado de m\u00e1quina, acesso e gerenciamento de dados, o valor dos data lakes \u00e9 mais incisivo.<\/p>\n<p><strong>Segundo,<\/strong> o fen\u00f4meno dos silos de dados \u00e9 eliminado. N\u00e3o h\u00e1 restri\u00e7\u00e3o quanto ao tipo de formato de dados, e todos os dados podem fluir para o data lake. Depois que os dados do usu\u00e1rio s\u00e3o gerados, eles podem ser armazenados diretamente no data lake de acordo com o conte\u00fado original e os atributos dos dados, sem qualquer processamento ou estrutura\u00e7\u00e3o dos dados antes de flu\u00edrem para o data lake.<\/p>\n<p>O <strong>terceiro<\/strong> \u00e9 atender \u00e0 expans\u00e3o el\u00e1stica do armazenamento de dados em larga escala dos usu\u00e1rios. Suporta tipos de dados complexos para usu\u00e1rios atuais, incluindo dados estruturados, como tabelas em bancos de dados relacionais, dados semiestruturados, como CSV, JSON, XML, logs, etc., e dados n\u00e3o estruturados, como e-mails, documentos, PDFs, gr\u00e1ficos, \u00e1udio, v\u00eddeo, etc. Os data lakes podem realizar a implanta\u00e7\u00e3o de armazenamento em larga escala no n\u00edvel PB e no n\u00edvel EB.<\/p>\n<p><strong>Quarto<\/strong>, a separa\u00e7\u00e3o de computa\u00e7\u00e3o e armazenamento \u00e9 alcan\u00e7ada. Em vista da dire\u00e7\u00e3o geral do futuro reconhecida pela ind\u00fastria, a arquitetura de separa\u00e7\u00e3o de armazenamento e computa\u00e7\u00e3o fornece escalabilidade independente, permitindo que os mecanismos de computa\u00e7\u00e3o se expandam conforme necess\u00e1rio enquanto os dados fluem para o lago. Mais importante, o modo desacoplado de armazenamento e computa\u00e7\u00e3o traz melhor desempenho de custo. Deve-se ressaltar que a separa\u00e7\u00e3o de computa\u00e7\u00e3o e armazenamento no lago de dados n\u00e3o significa que o mecanismo de processamento e an\u00e1lise de dados e o disco estejam em hosts diferentes, mas a separa\u00e7\u00e3o do armazenamento de conte\u00fado de dados e do mecanismo de processamento e an\u00e1lise de dados.<\/p>\n<h2>Como voc\u00ea determina se precisa de um data lake?<\/h2>\n<p>Ao determinar se sua empresa precisa de um data lake, voc\u00ea deve considerar o tipo de dados com os quais est\u00e1 lidando, o que deseja fazer com esses dados, a complexidade do seu processo de aquisi\u00e7\u00e3o de dados, seu gerenciamento de dados e <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/o-que-e-governanca-de-dados\/\">governan\u00e7a de dados<\/a><\/strong> estrat\u00e9gias e as ferramentas e n\u00edveis de habilidade usados pelas pessoas na sua organiza\u00e7\u00e3o.<\/p>\n<p>Hoje, as empresas est\u00e3o come\u00e7ando a olhar para o valor dos data lakes de uma perspectiva diferente, ou seja, os data lakes n\u00e3o s\u00e3o usados apenas para armazenar dados de fidelidade total, eles tamb\u00e9m podem ajudar os usu\u00e1rios a obter uma compreens\u00e3o mais profunda das condi\u00e7\u00f5es de neg\u00f3cios. Como os data lakes fornecem um contexto mais rico do que nunca, isso ajuda a acelerar os experimentos de an\u00e1lise.<\/p>\n<p>Data lakes s\u00e3o desenvolvidos principalmente para processar grandes volumes de big data, e as empresas podem frequentemente mover dados brutos para um data lake via lote e\/ou streaming sem transform\u00e1-los. As empresas dependem principalmente deles para os seguintes prop\u00f3sitos:<\/p>\n<ul>\n<li>Menor custo total de propriedade;<\/li>\n<li>Simplifique o gerenciamento de dados;<\/li>\n<li>Esteja preparado para incorporar intelig\u00eancia artificial e aprendizado de m\u00e1quina;<\/li>\n<li>Acelerar a an\u00e1lise;<\/li>\n<li>Aumente a seguran\u00e7a e a governan\u00e7a.<\/li>\n<\/ul>\n<h2>Quais s\u00e3o seus cen\u00e1rios de uso?<\/h2>\n<p>Como o data lake fornece a base para an\u00e1lises e intelig\u00eancia artificial, empresas de todos os setores o est\u00e3o usando para aumentar a receita, economizar dinheiro e reduzir riscos.<\/p>\n<ol>\n<li><strong>M\u00eddia e entretenimento: <\/strong>As empresas que oferecem streaming online de m\u00fasica, r\u00e1dio e podcasts podem aumentar a receita melhorando seus sistemas de recomenda\u00e7\u00e3o para que os usu\u00e1rios consumam mais de seus servi\u00e7os, permitindo que as empresas vendam mais an\u00fancios.<\/li>\n<li><strong>Telecomunica\u00e7\u00f5es:<\/strong> Empresas multinacionais de telecomunica\u00e7\u00f5es podem economizar dinheiro criando modelos de propens\u00e3o \u00e0 rotatividade para reduzir a rotatividade de clientes.<\/li>\n<li><strong>Servi\u00e7os financeiros:<\/strong> As empresas de investimento podem contar com data lakes para impulsionar o aprendizado de m\u00e1quina, para que possam gerenciar o risco do portf\u00f3lio assim que os dados de mercado em tempo real estiverem dispon\u00edveis.<\/li>\n<\/ol>\n<h2>Conclus\u00e3o<\/h2>\n<p>Obrigado por ler nosso artigo e esperamos que ele possa lhe dar uma melhor compreens\u00e3o do que \u00e9 um data lake. Se voc\u00ea quiser saber mais sobre isso, gostar\u00edamos de aconselh\u00e1-lo a visitar <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/\">Gudu SQLFlow<\/a><\/strong> para maiores informa\u00e7\u00f5es.<\/p>\n<p>Como um dos <strong><a href=\"https:\/\/www.dpriver.com\/blog\/2022\/05\/11\/best-data-lineage-tools\/\">melhores ferramentas de linhagem de dados<\/a><\/strong> dispon\u00edvel no mercado hoje, o Gudu SQLFlow pode n\u00e3o apenas analisar arquivos de script SQL, obter linhagem de dados e executar exibi\u00e7\u00e3o visual, mas tamb\u00e9m permitir que os usu\u00e1rios forne\u00e7am <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/base-de-conhecimento-de-linhagem-de-dados\/\">linhagem de dados<\/a><\/strong> no formato CSV e executar exibi\u00e7\u00e3o visual. <strong>(Publicado por Ryan em 29 de maio de 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":4191,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[31,178],"tags":[137,154,155,75,156],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts\/4147"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/comments?post=4147"}],"version-history":[{"count":45,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts\/4147\/revisions"}],"predecessor-version":[{"id":4195,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts\/4147\/revisions\/4195"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/media\/4191"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/media?parent=4147"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/categories?post=4147"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/tags?post=4147"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}