다양한 유형의 메타데이터
메타데이터는 데이터 유형을 정의하는 데 사용되는 데이터입니다. 주로 소스, 크기, 형식 또는 기타 데이터 특성을 포함하여 데이터 자체의 정보를 설명합니다. 데이터베이스 필드에서 메타데이터는 데이터베이스의 내용을 해석하는 데 사용됩니다. 데이터 레이크 Insight(DLI)는 테이블을 만들고, 열 이름, 유형, 열 설명의 세 열로 구성된 메타데이터를 정의합니다. 이 문서에서는 다양한 메타데이터 유형 그리고 어떻게 사용되는지.

메타데이터 유형
1. 메타데이터 유형에 따른 분류
- 기본 데이터에 대한 메타데이터: 기본 데이터는 데이터 소스에서 관리하는 모든 데이터를 말합니다. 데이터웨어하우스, 데이터마트, 및 응용 프로그램. 기본 데이터의 메타데이터에는 정의, 구조에 대한 모든 설명이 포함됩니다.
- 데이터 처리를 위한 메타데이터: 데이터 로딩, 업데이트 처리, 분석 처리 및 데이터 추출과 같은 관리에 대한 정보 데이터 변환및 집계 규칙.
- 기업의 조직 구조에 대한 메타데이터: 여기에는 특히 데이터 웨어하우스, 데이터 소스에 대한 사용자 액세스, 데이터 마트 권한 정보 등 기업과 관련된 관리 데이터 및 정보가 포함됩니다.
2. 추상화 수준에 따른 분류
- 개념 수준 메타데이터: 여기에는 주요 사업체, 특성 및 상호 관계, 시스템 사용, 정의된 쿼리, 뷰, 기존 애플리케이션 등 사업에 대한 전체 설명이 포함됩니다.
- 논리 수준 메타데이터: 여기에는 데이터베이스의 관계적 체계, 논리적인 다차원 모델 등이 포함되며, 데이터 추출/변환 규칙은 일반적으로 의사코드나 수학적 언어로 설명됩니다.
- 물리적 수준 메타데이터: 여기에는 비즈니스 규칙에 해당하는 SQL 코드, 관계에 대한 인덱스 파일, 분석 애플리케이션을 위한 코드가 포함됩니다.
3. 메타데이터가 수행하는 작업에 따른 분류
데이터웨어하우스의 메타데이터의 작업 분류에 따르면 다음과 같이 나눌 수 있습니다. 정적 메타데이터 그리고 동적 메타데이터.
정적 메타데이터 주로 데이터 구조와 관련되며 다음 요소를 포함합니다.
- 이름-클래스: 시스템에 식별 정보를 제공할 때 데이터를 구별하는 데 사용되는 기호입니다.
- 설명-클래스: 데이터 웨어하우스의 다양한 데이터 요소를 설명합니다.
- 포맷 클래스: 데이터웨어하우스의 데이터에 대한 표현 규칙을 제공합니다.
- 데이터 유형: 데이터웨어하우스의 데이터 유형입니다.
- 관계 클래스: 데이터 웨어하우스의 다양한 데이터 객체 간의 관계를 설명합니다. 예를 들어, 고객과 품목 간에 구매 관계가 있습니다.
- 도메인 클래스: 데이터웨어하우스의 데이터에 대한 유효한 값 범위를 설명하는 데 사용됩니다.
- 비즈니스 규칙 클래스: 데이터웨어하우스의 데이터가 비즈니스 처리에서 따라야 하는 규칙을 설명하는 데 사용됩니다. 예를 들어, Customer_ID는 고객 번호를 나타내며, 집합 고객의 경우 A로 시작하고 개별 고객의 경우 B로 시작합니다.
동적 메타데이터 주로 다음 요소를 포함하여 데이터의 상태 및 사용과 관련됩니다.
- 데이터 품질 테이블: 데이터 웨어하우스에 있는 데이터의 정확성, 완전성, 일관성 및 유효성을 설명하는 데 사용됩니다.
- 통계 정보: 데이터에 액세스하는 사용자, 액세스 시간 및 액세스 횟수를 계산합니다. 이러한 통계는 데이터웨어하우스 성능 개선을 위한 높은 참조 가치를 가지고 있습니다.
- 상태-계급: 데이터 웨어하우스의 상태를 추적하는 데 사용됩니다. 예를 들어, 데이터의 마지막 백업 시간, 백업에 필요한 시간, 오류 조건 등입니다. 이러한 시스템의 실행 상태는 데이터 웨어하우스 관리자가 데이터 웨어하우스의 성능을 이해하는 데 도움이 됩니다.
- 처리 클래스: 데이터웨어하우스 시스템의 사용 및 관리 특성을 설명하는 데 사용됩니다. 예를 들어, 데이터를 사용하는 방법, 데이터를 요약하는 일반 공식 등입니다.
4. 사용자 관점에서의 분류
이 분류 방법은 메타데이터가 사용되는 목적과 관련이 있습니다. 사용자 관점에서 이 분류 방법은 통일된 기준이 없으며 실제로는 습관, 실행 가능성 및 응용의 원칙에 따라 구분되는 경우가 많습니다.
일반적으로 두 가지 범주로 나뉩니다. 기술 메타데이터 그리고 비즈니스 메타데이터. 기술 메타데이터는 정보 기술 환경에서 기술과 긴밀하게 관련된 모든 분석, 설계, 개발, 관리 및 기타 메타데이터의 개발, 유지 관리 및 관리에 관한 것입니다. 개발 도구, 애플리케이션 및 시스템을 연결하는 기술적 링크입니다. 비즈니스 메타데이터는 엔터프라이즈 환경의 서비스를 최종 사용자에게 더 이해하기 쉽게 만들어 비즈니스 목표와 프로세스를 해석하기 위한 쉬운 탐색, 탐색 및 데이터 쿼리를 제공합니다.
기술 메타데이터 데이터베이스, 데이터웨어하우스, 데이터마트의 데이터 사전, 데이터 변환 규칙의 코드 등에 대한 설명 데이터를 포함합니다. 예:
- 운영 체제, 데이터 웨어하우스 및 OLAP 시스템의 아키텍처 및 구성, 테이블 구조, 속성 제한, 뷰 정보 등에 대한 설명 정보입니다.
- 다양한 정보 소스, 데이터웨어하우스, OLAP 시스템 간의 물리적 및 구현 수준 매핑과 종속성에 대한 설명입니다.
- 스케줄링 메타데이터를 추출합니다. 여기에는 스케줄링의 복잡한 관계, 소스 데이터와 타겟 데이터 간의 매핑이 포함됩니다.
- 시간 동기화를 위한 메타데이터.
- 사용자 권한 정보.
비즈니스 메타데이터 애플리케이션별 문서(사용자 프로필, 스토리지 맵, 사용 팁, 탐색 보조 도구 등), 비즈니스 개념 및 용어, 미리 정의된 쿼리 및 보고서의 세부 정보, 문맥 정보, 도량형 설명, 날짜 형식, 사전, 주제 표 등이 포함됩니다. 예:
- 사업 개념 모델.
- 다차원 데이터 모델, 차원의 집계 원칙, 차원 범주, 데이터 큐브, 데이터 마트.
- 비즈니스 개념 모델과 물리적 모델 간의 종속성.
- 비즈니스 개념에 대한 탐색과 탐색을 지원합니다.
- 비즈니스 개념에 맞춰 탐색 및 탐색을 지원합니다.
- 동적 즉각 쿼리 지원 및 데이터 마이닝.
결론
저희 기사를 읽어주셔서 감사합니다. 이 기사가 여러분이 다양한 것을 더 잘 이해하는 데 도움이 되기를 바랍니다. 메타데이터 유형 그리고 그것들이 어떻게 사용되는지. 메타데이터 유형에 대해 더 알고 싶다면, 다음을 방문하시기 바랍니다. Gudu SQLFlow 자세한 내용은.
그 중 하나로서 최고의 데이터 계보 도구 오늘날 시장에 출시된 Gudu SQLFlow는 SQL 스크립트 파일을 분석하고 얻을 수 있을 뿐만 아니라 데이터 계보, 시각적 표시를 수행할 뿐만 아니라, 사용자가 CSV 형식으로 데이터 계보를 제공하고 시각적 표시를 수행할 수 있도록 합니다. (2022년 6월 26일 Ryan이 게시)
2 Comments
Leave A Comment
이 글을 재미있게 읽으셨다면 아래의 다른 기사도 읽어보세요.
[…] 유연한 데이터 모델링 기능을 통해 데이터 유형 간의 모든 관계에 대한 중앙 집중화된 보기를 제공하고 복잡한 크로스 도메인 관계를 명확히 하며 유연한 다중 도메인 마스터 데이터를 제공합니다. […]
[…] 메타데이터 유형은 데이터 분석가가 다양한 비즈니스 시나리오에서 데이터를 적용하는 방법을 이해하는 데 도움이 됩니다. 더 많은 […]