{"id":4639,"date":"2022-06-24T23:29:41","date_gmt":"2022-06-25T07:29:41","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=4639"},"modified":"2022-06-27T18:36:48","modified_gmt":"2022-06-28T02:36:48","slug":"metadata-management-for-data-warehouses","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/pt\/gerenciamento-de-metadados-para-data-warehouses\/","title":{"rendered":"Gerenciamento de metadados para data warehouses | Gudu SQLFlow"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>Gerenciamento de Metadados para Data Warehouses<\/h2>\n<p><strong><a href=\"https:\/\/www.gudusoft.com\/pt\/o-que-e-gerenciamento-de-metadados\/\">Gerenciamento de metadados<\/a><\/strong> \u00e9 a base do empreendimento <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/category\/data-governance-101\/\">governan\u00e7a de dados<\/a><\/strong> e a melhoria de <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/o-que-e-um-data-warehouse\/\">Armaz\u00e9m de dados<\/a><\/strong>. Como algu\u00e9m que frequentemente trabalha com dados, a primeira tarefa \u00e9 entender o gerenciamento de metadados. Este artigo vai classificar o conceito de metadados e introduzir o gerenciamento de metadados para data warehouses.<\/p>\n<h3>O que \u00e9 gerenciamento de metadados para data warehouses?<\/h3>\n<p>Antes de prosseguir, vamos descobrir <strong>o que s\u00e3o metadados<\/strong> e <strong>o que \u00e9 um data warehouse<\/strong>.<\/p>\n<p><strong>Metadados<\/strong>, tamb\u00e9m conhecidos como dados intermedi\u00e1rios e dados de retransmiss\u00e3o, s\u00e3o dados sobre dados. Na maioria das vezes, metadados podem ser divididos em metadados de neg\u00f3cios e metadados t\u00e9cnicos de acordo com os diferentes significados que representam.<\/p>\n<p>UM <strong>Armaz\u00e9m de dados<\/strong> \u00e9 um reposit\u00f3rio central de informa\u00e7\u00f5es que podem ser analisadas para tomar melhores decis\u00f5es. Normalmente, os dados fluem regularmente para um data warehouse a partir de sistemas transacionais, bancos de dados relacionais e outras fontes. Analistas de neg\u00f3cios, <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/data-engineers\/\">engenheiros de dados<\/a><\/strong>, <a href=\"https:\/\/www.gudusoft.com\/pt\/cientistas-de-dados\/\"><strong>cientistas de dados<\/strong><\/a>, e os tomadores de decis\u00e3o acessam dados por meio de ferramentas de intelig\u00eancia empresarial (BI), clientes SQL e outros aplicativos anal\u00edticos.<\/p>\n<div id=\"attachment_4664\" style=\"width: 955px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-4664\" decoding=\"async\" class=\"size-full wp-image-4664\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2.png\" alt=\"Gerenciamento de Metadados para Data Warehouses\" width=\"945\" height=\"532\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2-200x113.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2-300x169.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2-400x225.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2-600x338.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2-768x432.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2-800x450.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/06\/Metadata_Management_for_Data_Warehouses-2.png 945w\" sizes=\"(max-width: 945px) 100vw, 945px\" \/><p id=\"caption-attachment-4664\" class=\"wp-caption-text\">Gerenciamento de Metadados para Data Warehouses<\/p><\/div>\n<p><strong>Ent\u00e3o, o que \u00e9 gerenciamento de metadados para data warehouses?<\/strong><\/p>\n<p>Os metadados no data warehouse registram principalmente a defini\u00e7\u00e3o de cada tema, o relacionamento de mapeamento entre diferentes n\u00edveis, o status dos dados do data warehouse de monitoramento e o status de execu\u00e7\u00e3o da tarefa. <a href=\"https:\/\/www.gudusoft.com\/pt\/melhores-ferramentas-etl\/\"><strong>ETL<\/strong><\/a>. Geralmente, os metadados s\u00e3o armazenados e gerenciados uniformemente por meio do reposit\u00f3rio de metadados, e seu principal objetivo \u00e9 obter coordena\u00e7\u00e3o e consist\u00eancia no design, implanta\u00e7\u00e3o, opera\u00e7\u00e3o e gerenciamento do data warehouse.<\/p>\n<p>Metadados s\u00e3o uma parte importante do sistema de gerenciamento de data warehouse. O gerenciamento de metadados \u00e9 um componente-chave no data warehouse empresarial. Ele percorre todo o processo de constru\u00e7\u00e3o do data warehouse e afeta diretamente a constru\u00e7\u00e3o, o uso e a manuten\u00e7\u00e3o do data warehouse.<\/p>\n<h3>Por que os data warehouses precisam de gerenciamento de metadados?<\/h3>\n<ol>\n<li><strong>Imprescind\u00edvel para a constru\u00e7\u00e3o de data warehouse<\/strong>: O data warehouse \u00e9 obtido de dados externos, dados de neg\u00f3cios e documentos por meio de algumas ferramentas ETL. Sem uma regra clara e clara, \u00e9 imposs\u00edvel realizar esse processo.<\/li>\n<li><strong>Ajuda a entender rapidamente o sistema de data warehouse<\/strong>: Por um lado, o data warehouse \u00e9 essencialmente um projeto importante de um departamento ou mesmo de uma empresa, e o tempo de desenvolvimento \u00e9 longo. Haver\u00e1 inevitavelmente um fluxo de pessoas no meio. Se n\u00e3o houver metadados claros, isso ter\u00e1 um grande impacto em todo o sistema e em todo o projeto. Por outro lado, o data warehouse serve como exporta\u00e7\u00e3o de dados anal\u00edticos para todo o departamento e empresa, n\u00e3o apenas para o pessoal de dados. A camada DM \u00e9 inevit\u00e1vel para pessoas de neg\u00f3cios e DIM para outros desenvolvedores. Se houver metadados claros para descrever o sistema de data warehouse, isso economizar\u00e1 muito tempo de comunica\u00e7\u00e3o entre as duas partes.<\/li>\n<li><strong>Comunica\u00e7\u00e3o eficiente e precisa<\/strong>: Por um lado, os metadados de gerenciamento nos metadados registram as permiss\u00f5es de dados de diferentes usu\u00e1rios, fun\u00e7\u00f5es e departamentos. Se houver dados que precisam ser notificados, voc\u00ea pode consultar rapidamente o sistema para se comunicar por e-mails em massa, etc., para evitar a situa\u00e7\u00e3o de falta de pessoas e muitas pessoas no link de comunica\u00e7\u00e3o. Por outro lado, ao se comunicar com produtos ou se comunicar com P&amp;D, voc\u00ea pode confirmar o significado de indicadores e dimens\u00f5es de comunica\u00e7\u00e3o m\u00fatua com base em metadados de neg\u00f3cios, para evitar a ambiguidade da comunica\u00e7\u00e3o na raiz e, assim, melhorar a efici\u00eancia da comunica\u00e7\u00e3o.<\/li>\n<li><strong>Garantido<\/strong> <a href=\"https:\/\/www.gudusoft.com\/pt\/como-melhorar-a-qualidade-dos-dados\/\"><strong>qualidade dos dados<\/strong><\/a>:Os metadados ideais descrevem a estrutura do data warehouse, o esquema do warehouse, as dimens\u00f5es, medidas, hierarquias, defini\u00e7\u00f5es dos bancos de dados em todos os lugares e a localiza\u00e7\u00e3o e o conte\u00fado do <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/o-que-e-um-data-mart-data-warehouse\/\">data marts<\/a><\/strong>. Portanto, podemos julgar com certeza quais dados s\u00e3o definitivamente precisos, quais dados podem estar com defeito e quais dados est\u00e3o definitivamente com defeito. Simplificando, cada campo deve ter seu intervalo de valor, defini\u00e7\u00e3o de neg\u00f3cio e outras informa\u00e7\u00f5es. Uma vez que os metadados s\u00e3o definidos, eles podem ser aplicados \u00e0 detec\u00e7\u00e3o de qualidade de dados, avalia\u00e7\u00e3o, etc., de modo a realmente melhorar a qualidade de dados das empresas por meio do processo de gerenciamento de qualidade de dados.<\/li>\n<li><strong>Reduza os custos de constru\u00e7\u00e3o do sistema de dados<\/strong>: Se os metadados estiverem bem estabelecidos, as informa\u00e7\u00f5es ser\u00e3o obtidas com mais precis\u00e3o e rapidez, de modo que a constru\u00e7\u00e3o do sistema de dados n\u00e3o ser\u00e1 retrabalhada ou menos retrabalhada, a carga de trabalho de an\u00e1lise ser\u00e1 reduzida, o entendimento unificado e a efici\u00eancia da comunica\u00e7\u00e3o de todas as partes ser\u00e3o fortalecidos e o custo de desenvolvimento ser\u00e1 minimizado.<\/li>\n<li><strong>Analise rapidamente o impacto da mudan\u00e7a<\/strong>: Como os metadados s\u00e3o mantidos e gerenciados centralmente com relacionamentos de refer\u00eancia, quando ocorrem altera\u00e7\u00f5es, o sistema de gerenciamento de metadados pode ser usado para analisar em tempo real as fun\u00e7\u00f5es comerciais afetadas, os sistemas de aplicativos, o pessoal envolvido e se a supervis\u00e3o est\u00e1 envolvida.<\/li>\n<li><strong>Prepare-se para o futuro<\/strong>: Sistemas de aplica\u00e7\u00e3o de n\u00edvel estrat\u00e9gico de empresas, como big data, intelig\u00eancia artificial, <a href=\"https:\/\/www.gudusoft.com\/pt\/o-que-e-um-data-lake\/\"><strong>lago de dados<\/strong><\/a>, data center e intelig\u00eancia empresarial podem contar com um bom gerenciamento de metadados para exercer seus devidos efeitos.<\/li>\n<\/ol>\n<h3>Cen\u00e1rios de aplica\u00e7\u00e3o de metadados<\/h3>\n<ol>\n<li><strong>An\u00e1lise de impacto<\/strong>: Durante o desenvolvimento, frequentemente encontramos os seguintes problemas: Se eu quiser alterar uma tabela ou ETL, qual ser\u00e1 o impacto? Se n\u00e3o houver metadados, ent\u00e3o podemos precisar percorrer todos os scripts e dados para obter a resposta desejada; no entanto, se houver gerenciamento de metadados maduro, ent\u00e3o podemos obter a resposta diretamente e economizar muito tempo.<\/li>\n<li><a href=\"https:\/\/www.gudusoft.com\/pt\/whats-data-lineage-why-important\/\"><strong>An\u00e1lise de linhagem de dados<\/strong><\/a>: A an\u00e1lise de linhagem de dados \u00e9 um meio t\u00e9cnico usado para rastrear de forma abrangente o processo de processamento de dados, de modo a encontrar todos os objetos de metadados relacionados a partir de um objeto de dados e o relacionamento entre esses objetos de metadados. O relacionamento entre objetos de metadados se refere especificamente ao relacionamento de entrada e sa\u00edda do fluxo de dados que representa esses objetos de metadados. Ap\u00f3s o sistema de gerenciamento de metadados ser formado, podemos analisar a sa\u00fade dos dados, distribui\u00e7\u00e3o de dados, concentra\u00e7\u00e3o e calor dos dados no data warehouse por meio da an\u00e1lise de relacionamento de linhagem.<\/li>\n<li><strong>Gerenciamento de automa\u00e7\u00e3o ETL<\/strong>: No warehouse, uma grande parte do ETL s\u00e3o etapas chatas e repetitivas. Por exemplo, na camada do sistema de origem-ODS: entrada de tabela \u2013 sa\u00edda de tabela. Outro exemplo \u00e9 ODS-DW: entrada SQL \u2013 limpeza de dados \u2013 processamento de dados \u2013 sa\u00edda de tabela. As regras acima s\u00e3o, na verdade, parte dos metadados. Isso pode ser alcan\u00e7ado em teoria, escreva um script fixo e, em seguida, selecione-o por meio do front-end \u2013 ou interface de API. Dessa forma, o ETL repetido pode ser gerenciado automaticamente para reduzir o custo de tempo do desenvolvimento de ETL.<\/li>\n<li><strong>Gest\u00e3o da qualidade dos dados<\/strong>: A l\u00f3gica da limpeza de dados pode ser simplesmente dividida em diferentes tipos de dados e colunas de processamento especiais designadas. Precisamos apenas especificar regras de limpeza padr\u00e3o para diferentes tipos de dados e l\u00f3gica de processamento especial para algumas colunas especiais para obter uma limpeza de dados inteligente e r\u00e1pida. O gerenciamento de qualidade de dados pertence \u00e0 interse\u00e7\u00e3o da governan\u00e7a de dados e do gerenciamento de metadados e \u00e9 mais inclinado \u00e0 governan\u00e7a de dados.<\/li>\n<li><strong>Gest\u00e3o de seguran\u00e7a de dados<\/strong>: No data center que Ali defende, todos os indicadores de interface de dados ser\u00e3o exportados do data warehouse. Portanto, em teoria, voc\u00ea s\u00f3 precisa configurar a permiss\u00e3o de gerenciamento de metadados nesses metadados para obter o gerenciamento de seguran\u00e7a de dados para toda a empresa.<\/li>\n<\/ol>\n<h3>Conclus\u00e3o<\/h3>\n<p>Obrigado por ler nosso artigo e esperamos que ele possa ajud\u00e1-lo a ter uma melhor compreens\u00e3o de <strong>gerenciamento de metadados para data warehouses<\/strong>. Se voc\u00ea quiser saber mais sobre gerenciamento de metadados para data warehouses, gostar\u00edamos de aconselh\u00e1-lo a visitar <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/\">Gudu SQLFlow<\/a><\/strong> para maiores informa\u00e7\u00f5es.<\/p>\n<p>Como um dos\u00a0<strong><a href=\"https:\/\/www.dpriver.com\/blog\/2022\/05\/11\/best-data-lineage-tools\/\" target=\"_blank\" rel=\"noopener noreferrer\">melhores ferramentas de linhagem de dados<\/a><\/strong> dispon\u00edvel no mercado hoje, o Gudu SQLFlow n\u00e3o s\u00f3 pode analisar arquivos de script SQL, obter linhagem de dados e executar exibi\u00e7\u00e3o visual, mas tamb\u00e9m permitir que os usu\u00e1rios forne\u00e7am linhagem de dados em formato CSV e executem exibi\u00e7\u00e3o visual.\u00a0<strong>(Publicado por Ryan em 25 de junho de 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":4663,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[178],"tags":[210,152,213,151,211,212],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts\/4639"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/comments?post=4639"}],"version-history":[{"count":28,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts\/4639\/revisions"}],"predecessor-version":[{"id":4669,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts\/4639\/revisions\/4669"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/media\/4663"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/media?parent=4639"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/categories?post=4639"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/tags?post=4639"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}