{"id":5410,"date":"2022-08-08T07:08:24","date_gmt":"2022-08-08T15:08:24","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=5410"},"modified":"2022-08-08T07:13:48","modified_gmt":"2022-08-08T15:13:48","slug":"data-lineage-techniques-best-practices-tools","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/pt\/tecnicas-de-linhagem-de-dados-melhores-praticas-e-ferramentas\/","title":{"rendered":"T\u00e9cnicas de linhagem de dados, melhores pr\u00e1ticas e ferramentas | Gudu SQLFlow"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>T\u00e9cnicas de linhagem de dados, melhores pr\u00e1ticas e ferramentas<\/h2>\n<p>O que \u00e9 <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/software-de-linhagem-de-dados-o-que-e-por-que-precisa-dele\/\">linhagem de dados<\/a><\/strong>? Quais s\u00e3o os <strong>t\u00e9cnicas de linhagem de dados<\/strong>, melhores pr\u00e1ticas e ferramentas? Neste artigo, responderemos a essas perguntas uma por uma.<\/p>\n<p>A linhagem de dados documenta a passagem de dados pelos sistemas de TI de uma empresa, mostrando como os dados se movem entre eles, transformando-os para diferentes usos no processo. Ela usa <a href=\"https:\/\/www.gudusoft.com\/pt\/o-que-sao-metadados\/\"><strong>metadados<\/strong><\/a> (dados sobre dados) para permitir que usu\u00e1rios finais e profissionais de gerenciamento de dados rastreiem o hist\u00f3rico de ativos de dados e obtenham informa\u00e7\u00f5es sobre sua import\u00e2ncia comercial ou atributos t\u00e9cnicos.<\/p>\n<p>Por exemplo, os registros de linhagem de dados podem ajudar <a href=\"https:\/\/www.gudusoft.com\/pt\/cientistas-de-dados\/\"><strong>cientistas de dados<\/strong><\/a>, outro <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/habilidades-de-analistas-de-dados\/\">analistas de dados<\/a><\/strong>, e os usu\u00e1rios corporativos entendem os dados que utilizam e garantem que sejam relevantes para suas necessidades de informa\u00e7\u00e3o. A linhagem dos dados tamb\u00e9m desempenha um papel importante <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/principios-de-governanca-de-dados\/\">governan\u00e7a de dados<\/a><\/strong>, mestre <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/o-que-e-gerenciamento-de-metadados\/\">gerenciamento de dados<\/a><\/strong>e programas de conformidade. Entre outras coisas nessas iniciativas, simplifica dois procedimentos-chave de governan\u00e7a de dados: analisar a causa raiz de <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/melhor-software-de-ferramentas-de-qualidade-de-dados\/\">qualidade dos dados<\/a><\/strong> quest\u00f5es e o impacto das altera\u00e7\u00f5es no conjunto de dados.<\/p>\n<div id=\"attachment_5416\" style=\"width: 946px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-5416\" decoding=\"async\" class=\"size-full wp-image-5416\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools.png\" alt=\"T\u00e9cnicas de linhagem de dados, melhores pr\u00e1ticas e ferramentas\" width=\"936\" height=\"510\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-18x10.png 18w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-200x109.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-300x163.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-400x218.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-600x327.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-768x418.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-800x436.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools.png 936w\" sizes=\"(max-width: 936px) 100vw, 936px\" \/><p id=\"caption-attachment-5416\" class=\"wp-caption-text\">T\u00e9cnicas de linhagem de dados, melhores pr\u00e1ticas e ferramentas<\/p><\/div>\n<p>As informa\u00e7\u00f5es de linhagem de dados s\u00e3o coletadas principalmente de sistemas operacionais (ao processar dados) e de <a href=\"https:\/\/www.gudusoft.com\/pt\/modernizacao-do-ambiente-de-data-warehouse\/\"><strong>armaz\u00e9ns de dados<\/strong><\/a> e <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/o-que-e-um-data-lake\/\">lagos de dados<\/a><\/strong> \u2013 onde conjuntos de dados s\u00e3o armazenados para aplica\u00e7\u00f5es de BI e an\u00e1lise. Al\u00e9m da documenta\u00e7\u00e3o detalhada, diagramas de fluxo de dados e diagramas podem ser criados para fornecer uma vis\u00e3o visual da linhagem de dados mapeada para processos de neg\u00f3cios. Para simplificar o acesso do usu\u00e1rio final \u00e0s informa\u00e7\u00f5es de linhagem, elas s\u00e3o frequentemente incorporadas a um <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/o-que-e-catalogo-de-dados-por-que-os-dados-datalog\/\">cat\u00e1logo de dados<\/a><\/strong>, que lista ativos de dados e os metadados associados a eles.<\/p>\n<h3>Por que a linhagem de dados \u00e9 importante?<\/h3>\n<p>Informa\u00e7\u00f5es sobre a linhagem dos dados s\u00e3o essenciais para os esfor\u00e7os de gerenciamento e an\u00e1lise de dados. Os detalhes da linhagem ajudam as empresas a gerenciar e usar os dados de forma eficaz. Sem acesso a esses detalhes, ser\u00e1 dif\u00edcil para as empresas explorarem plenamente o potencial valor comercial dos dados.<\/p>\n<p>Os seguintes s\u00e3o os <a href=\"https:\/\/www.gudusoft.com\/pt\/beneficios-da-linhagem-de-dados\/\"><strong>benef\u00edcios que a linhagem de dados oferece<\/strong><\/a>:<\/p>\n<p>An\u00e1lises mais precisas e \u00fateis. Ao tornar as equipes de an\u00e1lise e os usu\u00e1rios de neg\u00f3cios cientes da origem dos dados e do seu significado, a linhagem de dados melhora a capacidade de encontrar os dados necess\u00e1rios para uso em BI e ci\u00eancia de dados com mais rapidez. Isso leva a melhores resultados anal\u00edticos e aumenta a probabilidade de os esfor\u00e7os de an\u00e1lise de dados fornecerem informa\u00e7\u00f5es significativas para orientar as decis\u00f5es de neg\u00f3cios.<\/p>\n<p>Melhor governan\u00e7a de dados. A linhagem de dados tamb\u00e9m ajuda a rastrear dados e executar outras partes importantes do processo de governan\u00e7a. Ela ajuda os gerentes de governan\u00e7a de dados e os membros da equipe a garantir que os dados sejam v\u00e1lidos, limpos e consistentes, e que sejam protegidos, gerenciados e utilizados adequadamente.<\/p>\n<p>Maior seguran\u00e7a de dados e prote\u00e7\u00e3o da privacidade. As empresas podem usar informa\u00e7\u00f5es de linhagem de dados para identificar dados sens\u00edveis que exigem seguran\u00e7a particularmente forte. Elas tamb\u00e9m podem ser usadas para definir diferentes n\u00edveis de acesso do usu\u00e1rio de acordo com as pol\u00edticas de seguran\u00e7a e privacidade de dados, e para avaliar potenciais riscos de dados como parte de uma estrat\u00e9gia de gerenciamento de riscos corporativos.<\/p>\n<p>Melhore a conformidade regulat\u00f3ria. A linhagem de dados oferece melhores prote\u00e7\u00f5es de seguran\u00e7a, o que pode ajudar as empresas a garantir a conformidade com as leis de privacidade de dados e outras regulamenta\u00e7\u00f5es. Uma linhagem de dados bem documentada tamb\u00e9m facilita a realiza\u00e7\u00e3o de auditorias internas de conformidade e relat\u00f3rios de conformidade.<\/p>\n<p>Simplifique o gerenciamento de dados. Al\u00e9m de melhorias na qualidade dos dados, a linhagem de dados facilita uma variedade de outras tarefas de gerenciamento de dados. Exemplos incluem o gerenciamento de migra\u00e7\u00f5es de dados, a elimina\u00e7\u00e3o de silos de dados e a detec\u00e7\u00e3o e o tratamento de lacunas em conjuntos de dados.<\/p>\n<h3>Linhagem de dados, classifica\u00e7\u00e3o de dados e proveni\u00eancia de dados<\/h3>\n<p>A linhagem de dados tamb\u00e9m est\u00e1 intimamente relacionada aos dois processos de gerenciamento de dados: classifica\u00e7\u00e3o e proveni\u00eancia de dados. Vamos ver o que s\u00e3o e como diferem e se relacionam com a linhagem de dados.<\/p>\n<ul>\n<li><strong>Classifica\u00e7\u00e3o de dados.<\/strong> Isso envolve a atribui\u00e7\u00e3o de dados a diferentes categorias com base em suas caracter\u00edsticas, principalmente para fins de seguran\u00e7a e conformidade. A classifica\u00e7\u00e3o \u00e9 usada para classificar os dados de acordo com sua sensibilidade, por exemplo, como informa\u00e7\u00f5es pessoais, propriet\u00e1rias, confidenciais ou p\u00fablicas. Isso separa os conjuntos de dados que exigem n\u00edveis mais altos de seguran\u00e7a e controles de acesso mais rigorosos daqueles que n\u00e3o exigem. A linhagem de dados fornece informa\u00e7\u00f5es sobre um conjunto de dados que ajudam a classific\u00e1-lo.<\/li>\n<li><strong>Proveni\u00eancia dos dados.<\/strong> \u00c0s vezes, \u00e9 considerado sin\u00f4nimo de linhagem de dados, ou proveni\u00eancia de dados, que \u00e9 vista como um foco mais restrito na proveni\u00eancia dos dados, incluindo seu sistema de origem e como foram gerados. Nesse caso, linhagem e proveni\u00eancia de dados podem trabalhar juntas, com esta \u00faltima fornecendo documenta\u00e7\u00e3o de alto n\u00edvel sobre a origem dos dados e seu significado.<\/li>\n<\/ul>\n<h3>Linhagem de dados e governan\u00e7a de dados<\/h3>\n<p>A ess\u00eancia da governan\u00e7a de dados \u00e9 criar pol\u00edticas corporativas de dados e garantir que as pessoas as cumpram. Tais pol\u00edticas podem abranger diferentes inten\u00e7\u00f5es e incluir diretivas relativas \u00e0 prote\u00e7\u00e3o, verifica\u00e7\u00e3o e uso de dados. Gerentes de governan\u00e7a de dados e <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/administradores-de-dados\/\">administradores de dados<\/a><\/strong> deve reunir as necessidades de dados dos usu\u00e1rios empresariais e trabalhar com os membros do comit\u00ea de governan\u00e7a de dados para tomar decis\u00f5es para concordar com defini\u00e7\u00f5es comuns de dados, especificar m\u00e9tricas de qualidade de dados e desenvolver pol\u00edticas e procedimentos relacionados.<\/p>\n<p>No entanto, existe uma lacuna entre a defini\u00e7\u00e3o de pol\u00edticas de governan\u00e7a de dados e sua implementa\u00e7\u00e3o, e preencher essa lacuna \u00e9 um enorme desafio. \u00c9 a\u00ed que entra a linhagem de dados. Ela documenta as fontes e os fluxos de dados, permitindo que as equipes de governan\u00e7a monitorem como os dados se movem pelo sistema e como s\u00e3o modificados e utilizados. As informa\u00e7\u00f5es de linhagem ajudam a garantir a seguran\u00e7a dos dados e os controles de acesso adequados, al\u00e9m de armazenar, manter e utilizar os dados de acordo com as pol\u00edticas de governan\u00e7a.<\/p>\n<p>A linhagem de dados tamb\u00e9m pode simplificar tarefas espec\u00edficas relacionadas \u00e0 governan\u00e7a. Por exemplo, sem uma maneira de determinar onde erros de dados foram introduzidos no sistema, pode ser dif\u00edcil para administradores de dados e analistas de qualidade de dados identific\u00e1-los e corrigi-los. Isso tem consequ\u00eancias: se falhas de dados n\u00e3o forem descobertas, as empresas podem ser afetadas por resultados anal\u00edticos inconsistentes ou imprecisos, levando a decis\u00f5es comerciais ruins.<\/p>\n<p>Na an\u00e1lise da causa raiz de erros de dados, os registros de linhagem fornecem visibilidade sobre a sequ\u00eancia de etapas de processamento pelas quais um conjunto de dados passou. As empresas podem verificar os n\u00edveis de qualidade em cada etapa para identificar as fontes de erros nos dados. Trabalhando de tr\u00e1s para frente, a partir do ponto em que o erro foi descoberto, os administradores de dados podem verificar se os dados atendem \u00e0s expectativas iniciais ou se continham erros naquele momento. Ao identificar a etapa em que os dados est\u00e3o em conformidade na entrada, mas apresentam falhas na sa\u00edda, a equipe envolvida em um programa de governan\u00e7a de dados pode eliminar a causa raiz dos erros, e n\u00e3o apenas corrigir dados incorretos.<\/p>\n<p>A linhagem de dados tamb\u00e9m \u00e9 \u00fatil ao executar an\u00e1lises de impacto para entender problemas causados por mudan\u00e7as no formato e na estrutura dos dados de origem, um problema comum no ambiente de dados cada vez mais din\u00e2mico de hoje.<\/p>\n<p>Quando os dados mudam, podem ocorrer consequ\u00eancias indesejadas a jusante. Ao trabalhar desde o ponto de cria\u00e7\u00e3o ou coleta dos dados, os administradores de dados podem contar com a documenta\u00e7\u00e3o da linhagem dos dados para ajudar a rastrear depend\u00eancias de dados e identificar os est\u00e1gios de processamento afetados pelas altera\u00e7\u00f5es. Esses est\u00e1gios podem ent\u00e3o ser redesenhados para acomodar as altera\u00e7\u00f5es e garantir que os dados permane\u00e7am consistentes em todos os sistemas.<\/p>\n<h3>T\u00e9cnicas de linhagem de dados principais<\/h3>\n<p>As empresas podem utilizar diversas t\u00e9cnicas para coletar e registrar informa\u00e7\u00f5es sobre a linhagem de dados. Elas n\u00e3o s\u00e3o necessariamente mutuamente exclusivas, e as empresas podem utilizar mais de uma tecnologia de linhagem, dependendo dos requisitos de suas aplica\u00e7\u00f5es e da natureza de seu ambiente de dados. Os m\u00e9todos dispon\u00edveis incluem:<\/p>\n<div id=\"attachment_5422\" style=\"width: 897px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-5422\" decoding=\"async\" class=\"size-full wp-image-5422\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2.png\" alt=\"T\u00e9cnicas de linhagem de dados, melhores pr\u00e1ticas e ferramentas\" width=\"887\" height=\"512\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2-18x10.png 18w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2-200x115.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2-300x173.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2-400x231.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2-600x346.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2-768x443.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2-800x462.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/08\/Data_Lineage_Techniques_Best_Practices_and_Tools-2.png 887w\" sizes=\"(max-width: 887px) 100vw, 887px\" \/><p id=\"caption-attachment-5422\" class=\"wp-caption-text\">T\u00e9cnicas de linhagem de dados, melhores pr\u00e1ticas e ferramentas<\/p><\/div>\n<p>Key Data Lineage Techniques &#8211; 1. Data tag. By examining metadata, labels can be applied to datasets to help describe and characterize them for data lineage purposes. Tagging can be done manually by data stewards, other data governance team members, and end users, or automatically by software. For example, data lineage tools and lineage capabilities built into data governance software often include automated algorithms\u2014that users can run to label datasets.<\/p>\n<p>Principais T\u00e9cnicas de Linhagem de Dados \u2013 2. Linhagem baseada em padr\u00f5es. Essa abordagem busca padr\u00f5es em m\u00faltiplos conjuntos de dados, como elementos de dados, linhas e colunas semelhantes. Sua presen\u00e7a indica que os conjuntos de dados est\u00e3o relacionados entre si e podem fazer parte de um fluxo de dados, enquanto diferen\u00e7as nos valores ou atributos dos dados indicam que os dados foram transformados \u00e0 medida que se moviam de um sistema para outro. <a href=\"https:\/\/www.gudusoft.com\/pt\/o-que-e-transformacao-de-dados\/\"><strong>Transforma\u00e7\u00f5es de dados<\/strong><\/a> e os fluxos de dados podem ent\u00e3o ser registrados como parte de um registro de linhagem de dados.<\/p>\n<p>Principais T\u00e9cnicas de Linhagem de Dados \u2013 3. Linhagem baseada em an\u00e1lise sint\u00e1tica. Nesse caso, as ferramentas de linhagem de dados analisam a l\u00f3gica de transforma\u00e7\u00e3o de dados, arquivos de log de tempo de execu\u00e7\u00e3o, fluxos de trabalho de integra\u00e7\u00e3o de dados e outros c\u00f3digos de processamento de dados para identificar e extrair informa\u00e7\u00f5es de linhagem. A an\u00e1lise sint\u00e1tica fornece uma abordagem de ponta a ponta para rastrear a linhagem de dados em diferentes sistemas e pode ser mais precisa do que a linhagem baseada em esquema, mas tamb\u00e9m mais complexa.<\/p>\n<p>T\u00e9cnicas-chave de linhagem de dados \u2013 4. Outra abordagem \u00e9 totalmente manual: entreviste usu\u00e1rios de neg\u00f3cios, analistas de BI, cientistas de dados, administradores de dados, desenvolvedores de integra\u00e7\u00e3o de dados e outros funcion\u00e1rios para entender como os dados se movem pelo sistema e s\u00e3o usados e modificados. As informa\u00e7\u00f5es coletadas podem ser usadas para mapear fluxos e transforma\u00e7\u00f5es de dados, talvez como um ponto de partida para o planejamento da linhagem de dados antes da implanta\u00e7\u00e3o de t\u00e9cnicas mais automatizadas.<\/p>\n<h3>Melhores pr\u00e1ticas de linhagem de dados<\/h3>\n<p>Aqui est\u00e3o algumas pr\u00e1ticas recomendadas para ajudar a manter o processo de linhagem de dados no caminho certo e garantir que ele forne\u00e7a informa\u00e7\u00f5es precisas e \u00fateis sobre seu conjunto de dados:<\/p>\n<ul>\n<li>Envolva executivos e usu\u00e1rios da empresa desde o in\u00edcio. Um programa de governan\u00e7a de dados requer apoio e envolvimento executivo para ser bem-sucedido, e o mesmo se aplica \u00e0 linhagem de dados. O acesso ao suporte da alta ger\u00eancia \u00e9 um requisito para aprova\u00e7\u00e3o e financiamento. Gerentes e funcion\u00e1rios da empresa tamb\u00e9m devem ser envolvidos para garantir que as equipes de gerenciamento de dados entendam completamente como os dados s\u00e3o usados nos processos de neg\u00f3cios e para verificar a relev\u00e2ncia e a validade das informa\u00e7\u00f5es sobre a linhagem de dados.<\/li>\n<li>Documente a linhagem de dados t\u00e9cnicos e de neg\u00f3cios. A linhagem de neg\u00f3cios analisa cuidadosamente a origem dos dados, como eles fluem e seu contexto de neg\u00f3cios. A linhagem de tecnologia fornece detalhes sobre transforma\u00e7\u00f5es, integra\u00e7\u00f5es e pipelines de dados, bem como uma combina\u00e7\u00e3o de visualiza\u00e7\u00f5es de linhagem em n\u00edvel de tabela, coluna e consulta. A coleta dessas duas informa\u00e7\u00f5es fornece informa\u00e7\u00f5es \u00fateis para usu\u00e1rios de neg\u00f3cios e equipes de an\u00e1lise, por um lado, e para arquitetos de dados, modeladores de dados, analistas de qualidade de dados e outros profissionais de TI, por outro.<\/li>\n<li>Correlacione a linhagem de dados \u00e0s necessidades reais de neg\u00f3cios e TI. A linhagem de dados n\u00e3o deve ser um exerc\u00edcio acad\u00eamico. Para gerar os benef\u00edcios esperados, ela precisa ajudar a viabilizar melhores decis\u00f5es e estrat\u00e9gias de neg\u00f3cios, bem como uma governan\u00e7a de dados mais eficaz, melhor qualidade dos dados e outros benef\u00edcios na gest\u00e3o de dados. Caso contr\u00e1rio, \u00e9 prov\u00e1vel que seja um investimento desperdi\u00e7ado.<\/li>\n<li>Implemente uma abordagem corporativa para a linhagem de dados. Concentrar-se no processo de linhagem de dados para determinados conjuntos de dados tamb\u00e9m n\u00e3o \u00e9 t\u00e3o \u00fatil quanto poderia ser. Para realmente valer a pena, deve ser um esfor\u00e7o abrangente que envolva todos os dados da empresa, com um \u00fanico reposit\u00f3rio de metadados para apoiar o esfor\u00e7o de linhagem.<\/li>\n<li>Crie um cat\u00e1logo de dados que contenha informa\u00e7\u00f5es de linhagem de dados incorporadas. Encontrar e compreender dados relevantes costuma ser um grande desafio para usu\u00e1rios de BI e analytics. Ao criar um cat\u00e1logo de dados, as equipes de gerenciamento de dados podem fornecer um invent\u00e1rio dos ativos de dados dispon\u00edveis, que tamb\u00e9m inclui informa\u00e7\u00f5es de linhagem.<\/li>\n<\/ul>\n<h3>O que procurar em uma ferramenta de linhagem de dados?<\/h3>\n<p>Manually collecting metadata and documenting data lineage requires a significant investment of resources. It&#8217;s also error-prone and can cause big problems, especially as businesses increasingly rely on data analytics to drive business operations. Therefore, to do a better job of data governance, one should look for tools to manage data lineage representations and map them automatically across the enterprise.<\/p>\n<p>Se voc\u00ea decidir prosseguir com o processo de avalia\u00e7\u00e3o t\u00e9cnica para uma poss\u00edvel compra, procure ferramentas de linhagem de dados que possam:<\/p>\n<ul>\n<li>Acesse localmente uma ampla gama de fontes e produtos de dados, investigue os metadados que eles cont\u00eam e colete-os para governan\u00e7a de dados, cada vez mais por meio do uso de intelig\u00eancia artificial e algoritmos de aprendizado de m\u00e1quina;<\/li>\n<li>Agregar metadados capturados em um reposit\u00f3rio centralizado;<\/li>\n<li>Inferir tipos de dados e corresponder usos comuns de dados de refer\u00eancia a elementos de dados de diferentes sistemas;<\/li>\n<li>Fornecer aos usu\u00e1rios finais uma apresenta\u00e7\u00e3o simplificada de metadados agregados e dar suporte \u00e0 colabora\u00e7\u00e3o para validar descri\u00e7\u00f5es de metadados;<\/li>\n<li>Um mapeamento de ponta a ponta de como os dados fluem pelos sistemas de uma organiza\u00e7\u00e3o;<\/li>\n<li>Gerar uma representa\u00e7\u00e3o visual da linhagem de dados;<\/li>\n<li>Fornece uma API para que os desenvolvedores possam criar aplicativos que possam consultar registros de linhagem;<\/li>\n<li>Crie \u00edndices invertidos que mapeiem nomes de elementos de dados para seus usos em diferentes est\u00e1gios de processamento;<\/li>\n<li>Fornecer recursos de pesquisa para rastrear rapidamente o fluxo de dados de um ponto de origem de dados at\u00e9 um destino posterior;<\/li>\n<li>Permite que os usu\u00e1rios monitorem o fluxo de dados direto e reverso.<\/li>\n<\/ul>\n<h3>Conclus\u00e3o<\/h3>\n<p>Agradecemos a leitura do nosso artigo e esperamos que ele possa ajud\u00e1-lo a entender melhor as t\u00e9cnicas, melhores pr\u00e1ticas e ferramentas de linhagem de dados. Se quiser saber mais sobre t\u00e9cnicas e ferramentas de linhagem de dados, recomendamos que visite <a href=\"https:\/\/sqlflow.gudusoft.com\/#\/\" rel=\"dofollow\"><strong>Gudu SQLFlow<\/strong><\/a> para maiores informa\u00e7\u00f5es.<\/p>\n<p>Como uma das melhores ferramentas de linhagem de dados dispon\u00edveis no mercado hoje, o Gudu SQLFlow n\u00e3o s\u00f3 pode analisar arquivos de script SQL, obter linhagem de dados e executar exibi\u00e7\u00e3o visual, mas tamb\u00e9m permitir que os usu\u00e1rios forne\u00e7am linhagem de dados no formato CSV e executem exibi\u00e7\u00e3o visual. <strong>(Publicado por Ryan em 8 de agosto de 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":5425,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[178],"tags":[350,137,55,348,347,285,56,75,351,349],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts\/5410"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/comments?post=5410"}],"version-history":[{"count":15,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts\/5410\/revisions"}],"predecessor-version":[{"id":5429,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts\/5410\/revisions\/5429"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/media\/5425"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/media?parent=5410"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/categories?post=5410"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/tags?post=5410"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}