메타데이터 저장소란 무엇인가요?

에이 메타데이터 저장소 저장하기 위해 만들어진 데이터베이스입니다 메타데이터메타데이터는 실제 데이터를 포함하는 구조에 대한 정보입니다. 메타데이터는 종종 "데이터에 대한 데이터"로 여겨지지만, 이는 오해의 소지가 있습니다. 데이터 프로파일은 실제 "데이터에 대한 데이터"의 한 예입니다. 메타데이터는 이러한 정의에 추상화 계층을 추가합니다. 즉, 데이터를 포함하는 구조에 대한 데이터입니다. 메타데이터는 어떤 형식으로든 저장된 모든 주제의 모든 데이터의 구조를 설명할 수 있습니다.

잘 설계된 메타데이터 저장소는 다양한 데이터 구조의 단순한 정의를 훨씬 뛰어넘는 데이터를 포함하는 경우가 많습니다. 일반적인 저장소는 각 데이터 구조에 대한 수십 개에서 수백 개의 서로 다른 정보를 저장합니다.

메타데이터 저장소

메타데이터 저장소

메타데이터 저장소의 정의:

메타데이터 저장소는 메타데이터를 물리적으로 저장하고 분류하는 역할을 합니다. 메타데이터 저장소의 데이터는 일반적이고, 통합적이며, 최신이고, 과거 데이터여야 합니다.

일반: 메타모델은 애플리케이션별로 정의된 방식이 아닌 일반적인 용어로 메타데이터를 저장해야 합니다. 따라서 데이터베이스 표준이 제품별로 변경되더라도 메타데이터 저장소의 물리적 메타모델을 변경할 필요가 없습니다. 올인원 메타데이터 저장소의 기능을 통해 모든 비즈니스 도메인에 대한 메타데이터를 통합된 방식으로 관리할 수 있습니다. 즉, 조직의 모든 도메인과 주제 영역을 포괄합니다. 메타데이터 저장소는 현재 및 과거 메타데이터에 대한 접근이 가능해야 합니다. 이 메타데이터 저장소는 이전에는 데이터 사전이라고 불렸습니다.

비즈니스 인텔리전스를 위한 메타데이터 사용에 대한 수요가 증가함에 따라 메타데이터 저장소의 범위도 확대되었습니다. 기존의 데이터 사전은 기술이 비즈니스와 상호 작용하는 데 가장 가까운 곳입니다. 데이터 사전은 초기 단계에서는 메타데이터 저장소의 전체 영역을 차지하지만, 범위가 확장됨에 따라 비즈니스 용어집 그리고 비즈니스 측에 나타나는 다양한 상태 태그의 태그가 기술 측에 나타나고 기술 메타데이터의 소비, 그 계보 및 연결은 비즈니스와 기술을 하나로 모으는 귀중한 보고서인 저장소의 소스가 됩니다. 데이터 관리 결정이 더 쉬워지고, 변화의 비용을 평가할 수 있습니다.

메타데이터 저장소는 기업 전체를 탐색합니다. 데이터 거버넌스, 데이터 품질 그리고 마스터 데이터 관리(마스터 데이터와 참조 데이터 모두)를 수행하고, 이러한 풍부한 정보를 조직 전체의 통합 메타데이터와 통합하여 다양한 시스템에서 사용되는 구조만을 반영하더라도 데이터 구조에 대한 의사 결정 지원 시스템을 제공합니다.

저장소 및 레지스트리

저장소는 레지스트리에 비해 추가적인 기능을 제공합니다. 메타데이터 저장소는 메타데이터 레지스트리와 같은 메타데이터를 저장할 뿐만 아니라 관련 메타데이터에 관계를 추가합니다. 메타데이터 유형조직에 진입하여 성과물로 이어지는 흐름 속의 관련 메타데이터는 해당 데이터 포인트에 대한 계보로 간주됩니다.

다른 관련 메타데이터 유형과 관련된 메타데이터를 링크라고 합니다. 메타데이터 저장소는 조직의 모든 메타데이터 지점과 연결되고 변경 사항 처리를 위한 무결성을 유지하는 아키텍처를 제공함으로써 데이터의 전체 흐름, 정의 및 영향을 이해하는 데 필요한 기본 자료를 제공합니다. 마찬가지로 중요한 기능은 버전 제어를 유지하는 것이지만, 이 비교 설명은 논의의 여지가 있습니다. 이러한 정의는 아직 개발 중이므로 정의의 정확성을 개선해야 합니다.

레지스트리의 목적은 메타데이터 요소를 정의하고 조직 전체에 걸쳐 관리하는 것입니다. 데이터 모델 및 기타 데이터 관리 팀은 변경 사항이 있을 경우 레지스트리를 참조합니다. 메타데이터 저장소는 조직의 다양한 메타데이터 시스템에서 메타데이터를 가져와 업스트림 콘텐츠를 반영합니다. 저장소는 업스트림 역할을 하지 않지만, 레지스트리는 메타데이터 변경 사항의 업스트림 역할을 합니다.

메타데이터 저장소를 사용하는 이유:

메타데이터 저장소는 조직 데이터 컨테이너의 모든 구조를 하나의 통합된 위치로 통합할 수 있도록 합니다. 이를 통해 계산된 비즈니스 의사 결정을 위한 풍부한 리소스 정보를 확보할 수 있습니다. 이 도구는 공통적인 형태의 데이터 모델을 사용하여 모든 모델을 통합함으로써 조직의 모든 애플리케이션과 프로그램을 하나의 형식으로 통합합니다.

가장 중요한 점은 비즈니스 정의와 비즈니스 프로세스를 적용함으로써 비즈니스와 기술을 더욱 긴밀하게 연결하여 조직이 명확한 목표를 가진 탄탄한 로드맵을 구축하는 데 도움이 된다는 것입니다. 원스톱 정보를 통해 기업은 변화에 대한 통제력을 강화하고 도구에 대한 영향 분석을 수행할 수 있습니다.

기업은 종종 결과와 영향에 대한 연구를 기반으로 조직의 데이터 관리 체계를 변경하거나 새로운 데이터 구조를 추가하거나 제거하는 의사 결정을 내리는 데 많은 시간과 비용을 투자합니다. 잘 구조화되고 잘 관리되는 저장소를 사용하면 (다른 변수가 일정하다고 가정할 때) 아이디어 단계에서 제품 출시 단계까지 걸리는 시간을 최소화할 수 있습니다.

메타데이터 저장소 디자인

각 데이터베이스 관리 시스템(DBMS)과 데이터베이스 도구는 메타데이터 구성 요소에 대한 자체 언어를 가지고 있습니다. 데이터베이스 애플리케이션은 이미 자체 저장소 또는 레지스트리를 가지고 있으며, 이를 통해 저장된 데이터에 액세스하는 데 필요한 모든 기능을 제공해야 합니다. 공급업체는 다른 회사가 자사 제품에서 경쟁사 제품으로 데이터를 쉽게 마이그레이션하는 것을 원하지 않기 때문에 메타데이터를 독점적으로 처리합니다. CASE 도구, DBMS 사전, ETL 도구, 데이터 정리 도구, OLAP 도구 및 데이터 마이닝 모든 도구는 각기 다른 방식으로 메타데이터를 처리하고 저장합니다. 모든 도구에서 메타데이터 구성 요소를 저장하도록 설계할 수 있는 메타데이터 저장소는 단 하나뿐입니다.

메타데이터 저장소는 메타데이터를 소유권, 설명적 특성, 규칙 및 정책, 그리고 물리적 특성의 네 가지 범주로 저장해야 합니다. 소유권은 데이터 소유자와 애플리케이션 소유자를 나타냅니다. 설명적 특성은 이름, 유형, 길이뿐만 아니라 비즈니스 데이터 또는 비즈니스 프로세스를 설명하는 정의를 정의합니다. 규칙과 정책은 보안, 데이터 정리, 데이터 타임라인 및 관계를 정의합니다. 물리적 특성은 출처 또는 원점과 물리적 위치를 정의합니다.

데이터베이스를 구축하기 위해 논리적 데이터 모델을 구축하는 것처럼, 논리적 메타모델은 비즈니스 데이터의 메타데이터 요구 사항을 파악하는 데 도움이 될 수 있습니다. 메타데이터 저장소는 중앙 집중형, 분산형 또는 분산형으로 구성됩니다.

중앙 집중형 설계는 기업 전반의 모든 애플리케이션에 대한 메타데이터를 저장하는 메타데이터 저장소를 위한 데이터베이스를 제공하는 것을 의미합니다. 중앙 집중형 메타데이터 저장소는 중앙 집중형 데이터베이스와 동일한 기능을 제공합니다. 모든 데이터가 하나의 데이터베이스에 저장되므로 관리가 더 쉽지만, 병목 현상이 발생할 수 있다는 단점이 있습니다.

분산형 메타데이터 저장소는 위치 및/또는 사업부별로 분리된 여러 데이터베이스에 메타데이터를 저장합니다. 이는 중앙 집중형 메타데이터 저장소에 비해 저장소 관리가 복잡하지만, 메타데이터를 부서별로 세분화할 수 있다는 장점이 있습니다.

분산형 메타데이터 저장소는 분산형 접근 방식을 사용하지만, 분산형 메타데이터 저장소와 달리 메타데이터는 원래 애플리케이션에 그대로 유지됩니다.

결론

저희 글을 읽어주셔서 감사합니다. 이 글이 메타데이터 저장소를 더 잘 이해하는 데 도움이 되기를 바랍니다. 메타데이터 저장소에 대해 더 자세히 알아보려면 다음 링크를 방문하세요. Gudu SQLFlow 자세한 내용은 다음을 참조하세요. 최고의 데이터 계보 도구 현재 시중에 판매되고 있는 Gudu SQLFlow는 SQL 스크립트 파일을 분석하고, 데이터 계보를 얻고, 시각적으로 표시할 수 있을 뿐만 아니라, 사용자가 CSV 형식으로 데이터 계보를 제공하고 시각적으로 표시할 수 있도록 해줍니다. (2022년 7월 2일 Ryan 게시)

Gudu SQLFlow Live를 사용해 보세요

SQLFlow 클라우드 버전

주간 뉴스레터 구독하기

2 Comments

  1. […] 유연한 데이터 모델링 기능을 갖춘 확장 가능한 마스터 데이터 저장소는 […] 간의 모든 관계에 대한 중앙 집중식 보기를 제공합니다.

  2. […] 저장소 또는 데이터 저장소는 시스템이 […] 때문에 데이터를 보관해야 하는 상황을 나타내기 위해 데이터 흐름 다이어그램에서 사용됩니다.

Leave A Comment