엔터프라이즈 메타데이터 관리 플랫폼
모든 종류의 디지털화의 영향으로 기업 환경에서 다양한 메타데이터를 통합하고 활용하는 것이 중요합니다. 기업의 경우, 메타데이터 관리 도구 그들에게 맞는 방법을 선택하면 기업이 데이터 측면에서 전략적 목표를 달성하는 데 도움이 되는 메타데이터의 역할을 극대화할 수 있습니다.
기업 내의 다양한 역할은 메타데이터 도구에 대한 기대치가 다를 수 있지만, 이러한 기대치는 기본적으로 메타데이터 관리 도구의 상위 10개 기능에 매핑될 수 있습니다. 물론 이러한 기능은 핵심 기술에 의해 지원됩니다. "메타데이터 관리가 미래 기업 정보화의 핵심 인프라가 될 것입니다."
실제로 빅데이터 환경에서 기업이 다양한 복잡한 정보를 효율적으로 관리하지 못한다면 메타데이터 관리, 정보를 효과적으로 활용하기 어렵습니다. 그러나 많은 기업은 메타데이터 관리가 기업 비즈니스 혁신에 직접적으로 가져다주는 가치가 매우 제한적이라는 것을 점차 깨닫고 있습니다.

엔터프라이즈 메타데이터 관리
현재 메타데이터 관리 현황은 어떠한가?
메타데이터 관리가 비즈니스 혁신에 직접적인 가치를 가져다줄 수 없는 주된 이유는 다음의 네 가지 측면에 있습니다.
- 관리범위가 좁다: 현재 메타데이터 관리의 좁은 범위는 주로 두 가지 측면에서 반영됩니다. 첫째, 메타데이터는 다음과 관련됩니다. 데이터웨어하우스 관리되고 있으며, 메타데이터 관리가 전체 엔터프라이즈 수준으로 확장되지 않았습니다. 둘째, 데이터 웨어하우스 분야에서도 기술 메타데이터의 일부만 관리됩니다. 기술 메타데이터가 부족하면 메타데이터 시스템이 엔터프라이즈 시스템의 실제 상황을 보여주지 못합니다. 비즈니스 메타데이터가 부족하면 특정 비즈니스 의미가 없는 테이블 구조가 무더기로 생깁니다.
- 사업 통합의 어려움: 비즈니스와의 통합이 부족하여 많은 회사가 메타데이터 관리 시스템을 완성한 후 데이터 관리 부서의 내부 인력만 사용하고 다른 부서의 사람들은 전혀 사용할 수 없다는 것을 알게 됩니다. 모든 시스템은 비즈니스에 서비스해야 합니다. 한 부서에서만 사용하는 시스템은 생명력이 없습니다. 모든 부서의 사람들이 메타데이터 관리 시스템을 사용하는 것이 매우 중요합니다.
- 응용 시나리오 부족: 현재 대부분의 메타데이터 적용 시나리오는 계통 분석, 버전 관리 등과 같은 메타데이터 시스템 내부 기능에 국한되어 있습니다. 이러한 기능은 기업에서 정보화에 활용하고 있지만, 사실 메타데이터의 역할은 이러한 제한된 기능에만 반영되는 것은 아닙니다.
- 불완전한 기술: 불완전한 기술로 인해 위와 같은 일련의 문제가 발생했습니다. 확장성이 강하지 않아 많은 메타데이터 관리 도구가 기업의 비즈니스 데이터와 구조를 관리할 수 없습니다. 수집 능력이 부족하여 수동 보조 기록만 있고 노동 비용이 높으며 완전한 정보 링크를 구축할 수 없습니다. 실시간 성능이 높지 않아 많은 기업의 메타데이터 관리가 여전히 T+1(또는 T+1이 아님) 단계에 있으며 실시간으로 데이터 자산의 상태를 파악할 수 없고 기업 데이터 증가 속도를 따라잡을 수 없습니다.
오늘날 시장에서는 엔터프라이즈 메타데이터 관리에 대한 수요가 증가하고 있습니다.
1. 디지털화가 가속화되고 있으며, 기업의 데이터 양도 기하급수적으로 증가하고 있습니다.
디지털 시대의 도래와 함께 많은 복잡하고 변화 가능한 정보를 측정 가능한 데이터로 변환하여 통합 처리를 위해 컴퓨터에 도입할 수 있습니다. 관련 연구에 따르면 기업에서 수집하고 사용하는 데이터는 매년 기하급수적으로 증가할 것입니다. 이러한 방대한 양의 데이터를 효과적으로 관리하려면 엔터프라이즈 메타데이터 관리가 필요합니다.
2. 빅데이터 관련 기술의 등장으로 기업은 새로운 기회를 볼 수 있게 되었습니다.
빅데이터 관련 기술을 통해 기업 데이터의 가치를 최대한 활용할 수 있지만, 빅데이터는 종종 모바일 개인 데이터, 소셜 네트워크 데이터, 공공 데이터, 사물 인터넷 데이터 등 다양한 데이터 소스의 수집, 배포 및 공유를 의미합니다. 이 프로세스에는 기업 메타데이터 관리의 지원이 필요합니다.
3. 데이터 거버넌스에 대한 비즈니스 수요 증가
요즘 기업들은 빅데이터 활용에 주목하고 있지만, 빅데이터 활용의 전제는 고품질 데이터. 오늘날 많은 기업들이 다양한 내부 데이터 형식과 서로 다른 표준을 가지고 있습니다. 빅데이터 애플리케이션은 종종 다음으로 시작합니다. 데이터 거버넌스. 기업 데이터 거버넌스의 중요한 수단으로서 데이터 관리가 국내외 기업의 주목을 끌게 될 것입니다.
메타데이터 관리의 비즈니스 가치를 최대한 활용하려면 어떻게 해야 하나요?
메타데이터는 또한 실제 비즈니스 시나리오에 따라 속성을 정의합니다. 메타데이터는 이름 및 유형과 같은 공통 속성을 갖습니다. 다양한 유형의 메타데이터도 고유한 속성을 갖습니다. 메타데이터도 데이터이므로 데이터베이스에 저장해야 합니다. 메타데이터 리포지토리는 메타데이터를 저장하는 물리적 데이터베이스 테이블을 말합니다. 일반적으로 오픈 소스 관계형 데이터베이스(MySQL)를 사용하여 메타데이터 저장소를 실현합니다. 다음은 여러 측면에서 메타데이터를 관리하는 방법을 설명합니다.
1. 메타데이터 범위를 결정합니다.
먼저, 메타데이터 소스의 범위를 결정합니다. 실제 작업에서 모든 데이터를 메타데이터로 관리할 필요는 없습니다. 일반적으로 메타데이터 관리를 위해 비즈니스 데이터를 선택합니다. 비즈니스가 아닌 데이터는 관리 범위에 포함되지 않습니다. 주로 메타데이터 관리가 비즈니스와 개발자에게 비즈니스 데이터를 빠르게 파악하도록 하는 것이기 때문입니다.
규칙이 결정되면 회사의 실제 상황에 따라 어떤 비즈니스 시스템, 데이터베이스, 데이터베이스 사용자, 어떤 테이블에 메타데이터 관리가 필요한지 분류해야 합니다. 물론 Word, PDF 등과 같은 비정형 메타데이터 추출도 지원할 수 있습니다.
2. 메타데이터에 접근
메타데이터에 액세스하는 경우 일반적으로 소스 시스템에서 액세스합니다. 회사에 이미 데이터 웨어하우스가 있거나 실시간 요구 사항이 높지 않은 경우 개발 워크로드를 절약하기 위해 기존 메타데이터는 데이터 웨어하우스에서 액세스하고 연결되지 않은 메타데이터는 소스 시스템에서 액세스합니다. 그러나 이 솔루션도 위험합니다. 데이터 웨어하우스의 데이터가 소스 시스템과 일치하지 않으면 메타데이터 오류가 발생합니다. 대부분의 메타데이터 추출은 이제 구성 자동화 방식으로 수행됩니다.
3. 메타데이터 표준을 수립합니다.
정렬 과정에서 표준화되지 않은 데이터베이스나 데이터 정의가 있을 수 있으며, 이로 인해 메타데이터 관리가 불가능해질 수 있습니다. 다음으로, 주로 메타데이터의 무결성과 일관성을 보장하기 위해 프런트엔드 소스 데이터를 역전하여 정정하는 메타데이터 관리 사양을 수립해야 합니다.
다양한 유형의 회사의 요구 사항에 따라 메타데이터는 다양한 그룹에 개방됩니다. 따라서 메타데이터의 권한 관리 프로세스는 사양에 정의되어야 하며, 여기에는 메타데이터의 권한 계층, 메타데이터의 권한 적용 프로세스, 메타데이터의 릴리스 프로세스, 메타데이터의 승인 프로세스가 포함됩니다.
4. 메타데이터 유지관리.
메타데이터 유지관리는 주로 릴리스된 메타데이터를 유지관리하고 관리하는 것입니다. 온라인으로 릴리스된 메타데이터를 조정하거나 최적화해야 하는 경우 다시 메타데이터 릴리스 프로세스를 거쳐야 하며 메타데이터를 직접 수정하는 것은 허용되지 않습니다. 보안을 위해 모든 메타데이터 작업은 메타데이터 작업 로그에 기록해야 합니다.
메타데이터에 대한 카탈로그를 만들고, 다양한 메타데이터를 해당 카탈로그에 걸어두고, 주로 회사 요구 사항을 기반으로 비즈니스 프로세스, 비즈니스 주제 도메인, 개발 프로세스에 따라 해당 카탈로그를 디자인할 수 있습니다.
5. 메타데이터 검색, 분석 및 보고.
메타데이터의 퍼지 또는 정확한 빠른 검색을 지원하고, 주요 정보를 입력하여 해당 메타데이터를 찾는 별도의 페이지가 있습니다. 메타데이터는 데이터 자산의 한 유형으로 간주될 수도 있으므로 메타데이터 자산 보고서를 작성해야 하며, 이를 통해 메타데이터 액세스 인기도, 데이터 가치, 데이터 비용, 데이터 분포 및 기타 관련 정보를 빠르게 파악할 수 있습니다.
메타데이터의 응용분야는 무엇입니까?
기업은 다양한 사업과 복잡한 제품을 가지고 있으며, 다양한 시스템과 애플리케이션에서 방대한 양의 데이터를 형성합니다. 메타데이터를 통해 기업이 어떤 데이터를 가지고 있는지, 데이터가 무엇을 나타내는지, 데이터가 어디에서 왔는지, 시스템에서 어떻게 흐르는지 등을 이해하고, 메타데이터 관리를 수행하고, 비즈니스 용어, 데이터 표준, 데이터 사전, 데이터 자산 카탈로그와 같은 메타데이터 애플리케이션을 구축할 수 있습니다. 데이터 계보 데이터 분석, 데이터 맵 등에 대해서 알아보겠습니다. 다음에서는 주로 데이터 계보 관계와 데이터 맵에 대해서 말씀드리겠습니다.
1. 데이터 계통 분석
데이터 계보는 데이터와 데이터 간의 관계를 설명할 수 있는 메타데이터의 중요한 응용 프로그램입니다. 예를 들어, 이 테이블은 특정 시스템에서 추출되었습니다. 클러스터 계보 관계, 시스템 계보 관계, 테이블 수준 계보 관계 및 필드 계보 관계를 포함하여 이 필드와 해당 필드 간의 관계는 무엇입니까? 데이터의 업스트림 소스를 가리키고 업스트림 소스를 추적합니다.
상향 및 하향 테이블 수준 및 필드 수준의 추적성 데이터는 데이터 처리의 논리적 맥락을 명확하게 보여주고, 비정상 데이터 필드의 영향 범위를 빠르게 찾아내고, 데이터 백트래킹의 최소 범위를 정확하게 구분하고, 데이터 이해 및 데이터 문제 해결 비용을 줄일 수 있습니다. 계보 분석은 의료, 금융, 은행 및 제조를 포함한 많은 산업에서 제공되는 데이터의 특수 규제 및 규정 준수 요구 사항을 충족할 수 있습니다.
또한 영향 분석은 데이터의 다운스트림 흐름을 분석하는 데 사용되는 계보 관계 애플리케이션의 일부이기도 합니다. 시스템이 업그레이드되면 동적 데이터 구조 변경 및 삭제를 다운스트림 시스템에 적시에 알릴 수 있습니다. 데이터 종속 영향 분석을 통해 어떤 다운스트림 시스템, 어떤 테이블 및 어떤 필드가 메타데이터 수정의 영향을 받는지 신속하게 찾을 수 있으므로 시스템 업그레이드로 인한 위험을 줄일 수 있습니다.
2. 데이터 맵
전체 데이터 시스템에서 데이터 맵은 관리자의 역할을 합니다. 데이터 정보를 그래픽 방식으로 표시하고 데이터 계산에 필요한 다양한 정보 매개변수를 나타냅니다. 데이터 개발자뿐만 아니라 제품에도 사용할 수 있습니다. 그리고 작업도 매우 친절합니다. 다음과 같은 부분이 포함되어 있습니다.
- 빠른 검색 위치: 검색 엔진을 통해 관련 데이터를 검색하며, 정확한 쿼리, 퍼지 쿼리, 테이블 이름 쿼리, 필드 쿼리, 설명 쿼리 등의 방식을 지원합니다.
- 표준화된 그래픽 표현: 그래픽 방식을 사용하여 페이지 논리를 구성합니다. 예를 들어, 데이터 품질 수준은 Wifi 아이콘 형태로 표시되어 육안으로 편리하고 볼 수 있으며 사용자가 요구하는 핵심 정보에 편리합니다.
- 과거 데이터 정보 축적: 많은 시나리오에서 과거 데이터는 재계산할 필요가 없으며 직접 끌어오면 반복 개발을 크게 피할 수 있습니다. 예를 들어, 신규 사용자 통계의 경우 과거 사용자 정보를 끌어와 일일 사용자 로그인 로그와 연결하여 일일 신규 사용자를 생성할 수 있습니다.
- 직접 연관 분석 도구: 데이터 정보가 플랫폼에 직접 저장되므로 보고서 플러그인을 호출하여 2차 처리 및 개발 없이 직관적인 보고서 정보를 빠르게 확인할 수 있어 개발 효율성이 크게 향상됩니다.
이를 통해 비즈니스 인력은 기업의 데이터가 무엇인지 이해하고, 데이터의 비즈니스적 의미를 통해 데이터를 더 잘 이해할 수 있으며, 기술 인력은 데이터의 전반적인 상황을 파악하고, 데이터 표준에 따라 데이터베이스 테이블을 구축하고, 입찰을 달성하고, 데이터 표준화를 달성할 수 있습니다. 데이터 계보와 데이터 맵은 데이터 컨텍스트를 특히 명확하게 만들어 더 이상 데이터가 엉망이라고 느끼지 않을 것입니다.
결론
저희 기사를 읽어주셔서 감사합니다. 이 기사가 엔터프라이즈 메타데이터 관리에 대한 더 나은 이해를 얻는 데 도움이 되기를 바랍니다. 엔터프라이즈 메타데이터 관리에 대해 더 자세히 알고 싶으시다면, 다음 사이트를 방문해 보시기 바랍니다. Gudu SQLFlow 자세한 내용은.
그 중 하나로서 최고의 데이터 계보 도구 현재 시중에 판매되고 있는 Gudu SQLFlow는 SQL 스크립트 파일을 분석하고, 데이터 계보를 얻고, 시각적으로 표시할 수 있을 뿐만 아니라, 사용자가 CSV 형식으로 데이터 계보를 제공하고 시각적으로 표시할 수 있도록 해줍니다. (Ryan이 2022년 7월 1일에 게시)
이 글을 재미있게 읽으셨다면 아래의 다른 기사도 읽어보세요.