{"id":5124,"date":"2022-07-15T20:26:50","date_gmt":"2022-07-16T04:26:50","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=5124"},"modified":"2022-07-15T20:26:50","modified_gmt":"2022-07-16T04:26:50","slug":"best-open-source-data-catalog-tools","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/pt\/melhores-ferramentas-de-catalogo-de-dados-de-codigo-aberto\/","title":{"rendered":"4 melhores ferramentas de cat\u00e1logo de dados de c\u00f3digo aberto para considerar em 2022"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2>4 melhores ferramentas de cat\u00e1logo de dados de c\u00f3digo aberto em 2022<\/h2>\n<p>Fundamentalmente, qualquer organiza\u00e7\u00e3o orientada por dados precisa <a href=\"https:\/\/www.gudusoft.com\/pt\/melhores-ferramentas-de-catalogo-de-dados\/\"><strong>ferramentas de cat\u00e1logo de dados<\/strong><\/a>. <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/o-que-e-catalogo-de-dados-por-que-os-dados-datalog\/\">Cat\u00e1logos de dados<\/a><\/strong> ajudar a criar um ambiente \u00fanico a partir do qual todos os dados de uma organiza\u00e7\u00e3o e o contexto sobre esses dados podem ser acessados, garantindo que as organiza\u00e7\u00f5es possam reduzir seu tempo de insight e tomar rapidamente decis\u00f5es de neg\u00f3cios baseadas em dados de alta qualidade. Se voc\u00ea est\u00e1 procurando por <strong>melhores ferramentas de cat\u00e1logo de dados de c\u00f3digo aberto<\/strong>, ent\u00e3o voc\u00ea veio ao lugar certo. Neste post, compilamos uma lista dos <strong>melhores ferramentas de cat\u00e1logo de dados de c\u00f3digo aberto em 2022<\/strong> para facilitar sua vida.<\/p>\n<div id=\"attachment_5129\" style=\"width: 828px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-5129\" decoding=\"async\" class=\"size-full wp-image-5129\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools.png\" alt=\"Melhores ferramentas de cat\u00e1logo de dados de c\u00f3digo aberto\" width=\"818\" height=\"471\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-200x115.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-300x173.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-400x230.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-600x345.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-768x442.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools-800x461.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/07\/Best_Open_Source_Data_Catalog_Tools.png 818w\" sizes=\"(max-width: 818px) 100vw, 818px\" \/><p id=\"caption-attachment-5129\" class=\"wp-caption-text\">Melhores ferramentas de cat\u00e1logo de dados de c\u00f3digo aberto<\/p><\/div>\n<h3>Melhores ferramentas de cat\u00e1logo de dados de c\u00f3digo aberto \u2013 1. Apache Atlas<\/h3>\n<p>Como um c\u00f3digo aberto <strong><a href=\"https:\/\/www.gudusoft.com\/pt\/o-que-e-gerenciamento-de-metadados\/\">gerenciamento de metadados<\/a><\/strong> ferramenta e plataforma de governan\u00e7a, o Apache Atlas \u00e9 incubado pela Hortonworks sob a \u00e9gide da Data Governance Initiative.<\/p>\n<p>Ele se juntou \u00e0 Apache Foundation Incubator em 2015 e se tornou um programa de ponta em 2017. O Apache Atlas \u00e9 amplamente reconhecido como um dos blocos de constru\u00e7\u00e3o das plataformas de dados modernas devido \u00e0 sua vis\u00e3o inicial de usar metadados para resolver os desafios de cataloga\u00e7\u00e3o, classifica\u00e7\u00e3o, descoberta, governan\u00e7a e colabora\u00e7\u00e3o de dados.<\/p>\n<p>Principais capacidades do Apache Atlas:<\/p>\n<ol>\n<li><strong>Classifica\u00e7\u00e3o de metadados:<\/strong> O Apache Atlas permite que voc\u00ea classifique automaticamente PII, dados sens\u00edveis e outros dados sens\u00edveis. Os ativos de dados podem ser associados a v\u00e1rias classifica\u00e7\u00f5es. Essas pol\u00edticas tamb\u00e9m s\u00e3o propagadas por meio da linhagem para garantir que os dados derivados herdem a mesma classifica\u00e7\u00e3o e os mesmos controles de seguran\u00e7a.<\/li>\n<li><strong>Tipos e inst\u00e2ncias de metadados:<\/strong> De acordo com a documenta\u00e7\u00e3o do Apache, um \u201ctipo\u201d \u00e9 uma defini\u00e7\u00e3o de como um tipo espec\u00edfico de objeto de metadados \u00e9 armazenado e acessado no Atlas, o que permite <a href=\"https:\/\/www.gudusoft.com\/pt\/administradores-de-dados\/\"><strong>administradores de dados<\/strong><\/a> para definir metadados t\u00e9cnicos e comerciais.<\/li>\n<li><strong>Busca e linhagem:<\/strong> A UI intuitiva no Apache Atlas permite explora\u00e7\u00e3o predefinida e tempor\u00e1ria de tipos de dados por tipo, categoria, valor de atributo ou texto livre. Al\u00e9m disso, ele ret\u00e9m um hist\u00f3rico de como a fonte de dados ou dados expl\u00edcitos foram constru\u00eddos e como evolu\u00edram ao longo do tempo.<\/li>\n<li><strong>Seguran\u00e7a e mascaramento de dados:<\/strong> O Apache Atlas \u00e9 principalmente uma ferramenta de governan\u00e7a de dados que permite seguran\u00e7a detalhada do acesso a metadados para configurar o controle de acesso sobre inst\u00e2ncias de entidade, bem como adicionar\/atualizar\/remover classifica\u00e7\u00f5es e assim por diante.<\/li>\n<\/ol>\n<h3>Melhores ferramentas de cat\u00e1logo de dados de c\u00f3digo aberto \u2013 2. Amundsen Lyft<\/h3>\n<p>Como uma plataforma de cat\u00e1logo de dados de c\u00f3digo aberto originalmente constru\u00edda pela equipe de engenharia da Lyft, a Amundsen abriu o c\u00f3digo em outubro de 2019, um ano ap\u00f3s o lan\u00e7amento para uso interno.<\/p>\n<p>O Amundsen tem uma comunidade coesa de colaboradores e usu\u00e1rios e \u00e9 amplamente adotado por outras organiza\u00e7\u00f5es criadas com base nessa ferramenta de cat\u00e1logo de dados de c\u00f3digo aberto para promover suas iniciativas de democratiza\u00e7\u00e3o de dados, governan\u00e7a e servi\u00e7os de metadados.<\/p>\n<p><strong>Principais capacidades da Amundsen:<\/strong><\/p>\n<ol>\n<li><strong>F\u00e1cil de encontrar dados confi\u00e1veis:<\/strong> O Amundsen ajuda a encontrar dados de diversas fontes com pesquisas de texto simples, e os resultados da pesquisa at\u00e9 exibem metadados online.<\/li>\n<li><strong>Metadados automatizados e selecionados:<\/strong> Quando um ativo de dados \u00e9 clicado, o usu\u00e1rio v\u00ea sua descri\u00e7\u00e3o detalhada e comportamento, que s\u00e3o selecionados manualmente e gerados automaticamente, respectivamente.<\/li>\n<li><strong>Capacidade de compartilhar contexto com colegas:<\/strong> As descri\u00e7\u00f5es dos ativos de dados podem ser atualizadas, reduzindo a necessidade de os colegas ficarem indo e voltando em busca de mais contexto para um ativo de dados espec\u00edfico.<\/li>\n<li><strong>Aprenda e entenda com o uso de dados:<\/strong> Os usu\u00e1rios podem ver quais ativos de dados s\u00e3o usados com frequ\u00eancia, possu\u00eddos ou marcados como favoritos e podem at\u00e9 mesmo ver as consultas mais comuns relacionadas a tabelas observando os pain\u00e9is criados em uma determinada tabela.<\/li>\n<\/ol>\n<h3>Melhores ferramentas de cat\u00e1logo de dados de c\u00f3digo aberto \u2013 3. LinkedIn DataHub<\/h3>\n<p>Como uma plataforma de gerenciamento de metadados de c\u00f3digo aberto desenvolvida pela equipe de engenharia do LinkedIn, o DataHub \u00e9 realmente a segunda tentativa do LinkedIn de abordar os desafios de cataloga\u00e7\u00e3o, descoberta, observabilidade e linhagem de dados.<\/p>\n<p>Antes do DataHub, eles criaram uma ferramenta de diret\u00f3rio de dados de c\u00f3digo aberto chamada WhereHows em 2016. O DataHub foi anunciado em 2019 e tornou-se de c\u00f3digo aberto em 2020. Como resultado, o LinkedIn mant\u00e9m duas vers\u00f5es diferentes do DataHub \u2014 uma para uso interno e outra de c\u00f3digo aberto para outras que podem ser criadas.<\/p>\n<p><strong>Principais capacidades do DataHub:<\/strong><\/p>\n<ol>\n<li><strong>Ingest\u00e3o automatizada de metadados:<\/strong> No LinkedIn DataHub, os metadados s\u00e3o ingeridos de diferentes fontes via API ou envio de fluxo do Kafka.<\/li>\n<li><strong>F\u00e1cil descoberta de dados:<\/strong> No n\u00edvel mais alto para usu\u00e1rios finais, o front-end do DataHub oferece suporte a tr\u00eas tipos de intera\u00e7\u00e3o: pesquisa, navega\u00e7\u00e3o e visualiza\u00e7\u00e3o\/edi\u00e7\u00e3o de metadados.<\/li>\n<li><strong>Entenda os dados por meio do contexto:<\/strong> Cada entidade de dados no DataHub vem com uma p\u00e1gina de perfil que exibe todos os metadados associados a essa entidade de dados, fornecendo ao usu\u00e1rio as informa\u00e7\u00f5es necess\u00e1rias para desenvolver esse contexto de dados.<\/li>\n<\/ol>\n<h3>Melhores ferramentas de cat\u00e1logo de dados de c\u00f3digo aberto \u2013 4. Netflix Metacat<\/h3>\n<p>Como um servi\u00e7o conjunto de gerenciamento de metadados criado pela Netflix e de c\u00f3digo aberto em junho de 2018, o Metacat visa simplificar a classifica\u00e7\u00e3o, descoberta, processamento e gerenciamento de dados.<\/p>\n<p>O Metacat forma principalmente uma \u00fanica fonte de acesso a todos os ativos de dados da Netflix. Embora o Metacat seja um cat\u00e1logo de dados de c\u00f3digo aberto, parece haver uma falta de conhecimento p\u00fablico significativo para que outros usem efetivamente seu esquema e o estendam.<\/p>\n<p><strong>Principais capacidades do Metacat:<\/strong><\/p>\n<ol>\n<li><strong>Abstra\u00e7\u00e3o de dados e interoperabilidade:<\/strong> O Metacat forma uma camada de abstra\u00e7\u00e3o comum, e os conjuntos de dados podem ser acessados por meio de v\u00e1rios mecanismos de consulta da Netflix.<\/li>\n<li><strong>Armazenamentos de metadados comerciais e DEFINIDOS PELO USU\u00c1RIO:<\/strong> O Metacat ajuda a documentar metadados comerciais e definidos pelo usu\u00e1rio sobre ativos de dados, garante que os usu\u00e1rios de dados recebam mais informa\u00e7\u00f5es sobre ativos de dados e regras padr\u00e3o sobre como lidar com eles.<\/li>\n<li><strong>Descoberta de dados:<\/strong> O Metacat fornece metadados de esquema e metadados definidos pelo usu\u00e1rio\/empresa para dados via ElasticSearch, o que ajuda na consulta por meio de pesquisa de texto.<\/li>\n<li><strong>Auditoria e notifica\u00e7\u00e3o de altera\u00e7\u00f5es de dados:<\/strong> Captura quaisquer altera\u00e7\u00f5es ou atualiza\u00e7\u00f5es de metadados, permitindo notifica\u00e7\u00f5es push para eventos que podem exigir a aten\u00e7\u00e3o do usu\u00e1rio.<\/li>\n<\/ol>\n<h3>Quais s\u00e3o os benef\u00edcios das ferramentas de cat\u00e1logo de dados de c\u00f3digo aberto?<\/h3>\n<p>Cat\u00e1logos de dados de alta qualidade n\u00e3o s\u00f3 permitem que voc\u00ea categorize corretamente todos os seus dados, como tamb\u00e9m permitem que voc\u00ea rastreie adequadamente os fluxos de dados entre diferentes tipos de dados e at\u00e9 mesmo mostre falhas nos fluxos de dados que voc\u00ea pode melhorar.<\/p>\n<p>Outro recurso interessante \u00e9 que dados sens\u00edveis tamb\u00e9m podem ser gerenciados, e a ferramenta pode identificar onde dados sens\u00edveis s\u00e3o mais exibidos, reduzindo assim o risco de vazamento. Algumas ferramentas de cat\u00e1logo de dados de ponta at\u00e9 oferecem recursos de aprendizado de m\u00e1quina que podem entender como voc\u00ea gerencia seus dados e ajud\u00e1-lo a processar grandes quantidades de dados. Mas por que usar a ferramenta de diret\u00f3rio de dados de c\u00f3digo aberto?<\/p>\n<p>Ferramentas de cat\u00e1logo de dados de c\u00f3digo aberto ainda s\u00e3o softwares de alta qualidade, baratos, \u00e0s vezes at\u00e9 gratuitos, mas s\u00e3o bem escal\u00e1veis, oferecem muitas op\u00e7\u00f5es de personaliza\u00e7\u00e3o e podem funcionar sem limita\u00e7\u00f5es, ideais para grandes volumes de dados.<\/p>\n<p>Al\u00e9m disso, como empresa ou organiza\u00e7\u00e3o, voc\u00ea n\u00e3o precisa se preocupar em depender de um desenvolvedor para atualiza\u00e7\u00f5es, pois pode contratar desenvolvedores para desenvolver ainda mais o software de c\u00f3digo aberto ou personaliz\u00e1-lo facilmente para atender \u00e0s suas necessidades.<\/p>\n<h3>Conclus\u00e3o<\/h3>\n<p>Obrigado por ler nosso artigo e esperamos que ele possa ajud\u00e1-lo a encontrar o <strong>melhores ferramentas de cat\u00e1logo de dados de c\u00f3digo aberto<\/strong> em 2022. Se voc\u00ea quiser encontrar mais informa\u00e7\u00f5es sobre ferramentas de cat\u00e1logo de dados de c\u00f3digo aberto, gostar\u00edamos de aconselh\u00e1-lo a visitar <a href=\"https:\/\/www.gudusoft.com\/pt\/\"><strong>Gudu SQLFlow<\/strong><\/a> para maiores informa\u00e7\u00f5es.<\/p>\n<p>Como um dos\u00a0<strong><a href=\"https:\/\/www.dpriver.com\/blog\/2022\/05\/11\/best-data-lineage-tools\/\" target=\"_blank\" rel=\"noopener noreferrer\">melhores ferramentas de linhagem de dados<\/a><\/strong>\u00a0dispon\u00edvel no mercado hoje, o Gudu SQLFlow pode n\u00e3o apenas analisar arquivos de script SQL, obter\u00a0<a href=\"https:\/\/www.gudusoft.com\/pt\/whats-data-lineage-why-important\/\"><strong>linhagem de dados<\/strong><\/a>, e executar exibi\u00e7\u00e3o visual, mas tamb\u00e9m permitir que os usu\u00e1rios forne\u00e7am linhagem de dados em formato CSV e executem exibi\u00e7\u00e3o visual.\u00a0<strong>(Publicado por Ryan em 16 de julho de 2022)<\/strong><\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":5141,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[178],"tags":[295,294,292,98,296,151,297,293],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts\/5124"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/comments?post=5124"}],"version-history":[{"count":18,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts\/5124\/revisions"}],"predecessor-version":[{"id":5144,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/posts\/5124\/revisions\/5144"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/media\/5141"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/media?parent=5124"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/categories?post=5124"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/pt\/wp-json\/wp\/v2\/tags?post=5124"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}