비즈니스 메타데이터 관리
현재 많은 기업들은 비즈니스 인력이 시스템에 저장된 데이터를 이해할 수 없기 때문에 빅데이터를 통해 비즈니스 혁신 역량을 개선하는 것이 어렵다는 것을 깨달았습니다. 이 글에서는 이 문제에 대한 해결책을 논의합니다. 사업 메타데이터 관리.
목차:
- 컴퓨터와 인간 사이에 '의미적 장벽'이 나타난다.
- 비즈니스 메타데이터 – 데이터 뒤에 있는 비즈니스 컨텍스트
- 온톨로지 기반 비즈니스 메타데이터 관리 관행
- 요약 및 전망.

비즈니스 메타데이터 관리
1. 컴퓨터와 인간 사이에 '의미적 장벽'이 나타난다.
약 70년 전 발렌타인 데이에 펜실베이니아 대학에서 에니악이 탄생했습니다. 그 이후로 인류는 컴퓨터의 "지능"을 탐구하기 시작했습니다. "언어 인식", "이미지 인식", "자연어 처리"와 같은 다양한 기술이 점점 더 성숙해지면서 우리는 원하는 거의 모든 정보를 컴퓨터 시스템에 입력할 수 있지만, 반대로 컴퓨터의 출력 데이터를 올바르게 이해할 수 있을까요?
데이터가 증가함에 따라 우리는 데이터 뒤에 있는 구체적인 의미를 파악하기 어려워졌습니다. 우리와 컴퓨터 시스템 사이에 의미적 장벽이 생겼습니다. 의미적 장벽의 존재는 기업에 일련의 문제를 가져옵니다.
- 불일치한 사업 이해: 직원들의 사업에 대한 불일치한 이해는 기업에서 매우 흔합니다. 사업 용어에 대한 불일치한 이해는 직원들이 의사 소통을 할 수 없게 만들고, 오해를 일으키고, 의사 소통 효율성을 떨어뜨립니다. 회의 의사 결정에서 리더의 사업에 대한 불일치한 이해는 잘못된 결정으로 이어질 수 있습니다. 부서 통계에서 사업 정의에 대한 불일치한 이해는 통계적 방법으로 이어질 것입니다. 불일치는 부정확한 통계로 이어지고, 심지어 기업의 여러 지표와 KPI의 통계 결과에 영향을 미칩니다.
- 정보 찾기는 어렵다: 빅데이터 시대에 기업 데이터의 양이 폭발적으로 증가하고 있으며, 직원들을 위한 정보 찾기는 점점 "건초더미에서 바늘 찾기"와 같아지고 있다. 통계에 따르면 기업 직원들은 매일 방대한 정보에서 필요한 데이터를 검색하는 데 15%에서 35%의 시간을 소비하고 있으며, 검색 결과 중 50% 미만만이 필요에 부합한다. 대부분의 경우 검색 결과가 만족스럽지 않다. 저장된 정보를 찾을 수 없기 때문에 회사는 종종 불필요한 중복 작업을 한다.
- 인력 손실이 크다: 통계에 따르면 기업에서 직원의 연평균 이직률은 약 12%이다. 기업 관리 방법이 정해져 있지 않기 때문에 기업은 종종 "컴퓨터"를 잘 아는 직원을 교육한 후 새로운 직원을 교육하는 데 많은 시간과 비용을 투자하여 심각한 지식 손실과 비용 소모를 초래한다.
위의 일련의 문제가 나타나는 것은 결국 기업 직원들이 컴퓨터의 데이터를 "읽을 수 없기" 때문입니다. 기업은 컴퓨터와 사람 사이의 의미적 장벽을 깨고, 컴퓨터 출력을 비즈니스 직원이 이해할 수 있는 비즈니스 언어로 전환하여 이러한 문제를 피해야 합니다. 비즈니스 메타데이터 문제를 해결하는 열쇠입니다.
2. 비즈니스 메타데이터 - 데이터 뒤에 있는 비즈니스 컨텍스트.
비즈니스 메타데이터가 무엇인지 명확히 하려면 먼저 메타데이터 분류부터 시작해야 합니다. 현재 업계에서 인정하는 분류 방법은 메타데이터를 기술적 메타데이터와 비즈니스 메타데이터의 두 가지 유형으로 나누는 것입니다.
그만큼 기술 메타데이터 다음이 포함됩니다: 필드 이름, 필드 길이, 데이터베이스 테이블 구조 등
그만큼 비즈니스 메타데이터 다음이 포함됩니다: 사업체 이름, 사업체 정의, 사업체 설명 등.
사업자는 기술적인 메타데이터에서 반영하기 어려운 '고객', '결제일', '판매금액' 등과 관련된 내용에 더 많은 주의를 기울입니다.
비즈니스 메타데이터는 기업 환경에서 다양한 속성과 개념을 나타내기 위해 비즈니스 이름, 정의, 설명 및 기타 정보를 사용합니다. 어느 정도 모든 데이터 뒤에 있는 비즈니스 컨텍스트는 비즈니스 메타데이터로 간주될 수 있습니다. 기술 메타데이터와 비교할 때 비즈니스 메타데이터는 사용자가 엔터프라이즈 환경에서 데이터를 더 잘 이해하고 사용할 수 있도록 합니다. 예를 들어, 사용자는 비즈니스 메타데이터를 보고 각 지표의 의미와 지표의 계산 방법을 명확하게 이해할 수 있습니다.
비즈니스 메타데이터는 엔터프라이즈 환경에 널리 존재합니다. 비즈니스 메타데이터의 주요 소스는 다음과 같습니다.
- ERP: 기업용 ERP 시스템은 재무 계산 공식, 프로세스 로직, 비즈니스 규칙 등 방대한 양의 비즈니스 메타데이터를 저장합니다.
- 보고서: 보고서의 헤더도 일종의 비즈니스 메타데이터입니다. 특히 합계 및 평균과 같은 요약 속성이 있는 열과 보고서의 일부 계산 수식이 여기에 해당합니다.
- 표: 보고서와 마찬가지로 EXCEL 헤더와 수식도 중요한 비즈니스 메타데이터입니다. 보고서와 달리 대부분의 표에는 "설명"에 대한 단일 열이 있으며, 일부 표에는 유용한 비즈니스 메타데이터인 코드 및 코드 설명에 대한 열도 있습니다.
- 파일: 제목, 작성자, 수정 시간 등 파일의 모든 곳에 비즈니스 메타데이터가 있습니다. 머신 러닝과 같은 기술을 사용하면 파일 콘텐츠에서 비즈니스 메타데이터를 얻는 것이 비교적 어렵습니다.
- BI 도구: BI에서 자주 사용되는 작업은 "드릴링" 작업입니다. 드릴업 및 드릴다운은 일반적으로 제품 수준 및 조직 구조 수준과 같은 기업의 다양한 분류 구조를 정의하는데, 이는 매우 중요한 비즈니스 메타데이터입니다.
- 데이터웨어하우스: 비즈니스 메타데이터는 데이터웨어하우스에도 존재합니다. 예를 들어, 데이터웨어하우스를 구축하려면 여러 데이터 소스를 통합하는 방법에 대한 많은 연구가 필요하며, 데이터웨어하우스 구축 프로세스와 관련된 파일에는 많은 비즈니스 메타데이터가 있습니다.
현재 대부분 기업은 기술 메타데이터에만 주의를 기울이고 비즈니스 메타데이터 관리를 무시합니다. 기술 메타데이터는 비즈니스 의미가 부족하고 기술자 외의 사람이 이해하기 어렵습니다. 예를 들어, "rec_temp_fld_a"를 사용하여 필드를 나타내고 "236IN_TAB"을 사용하여 데이터베이스의 테이블을 나타낼 수 있습니다. 비즈니스에 이익을 가져다주기 어렵습니다. 비즈니스 메타데이터는 데이터 뒤에 있는 비즈니스 의미를 나타낼 수 있습니다. 기업은 기술 메타데이터를 관리하는 동안 비즈니스 메타데이터 관리에 주의를 기울여야 합니다.
기술 메타데이터와 비교했을 때, 비즈니스 메타데이터의 소스는 더 복잡하고 기업 환경의 모든 측면에서 분산되어 있습니다. 비즈니스 메타데이터 관리를 실현하기 위해 기업은 효과적인 방법과 수단이 필요합니다.
3. 온톨로지 기반 비즈니스 메타데이터 관리 관행.
산업계에서 비교적 인정하는 온톨로지의 정의는 다음과 같다. 공유된 개념적 모델의 명확한 형식적 사양. 이 중 개념적 모델은 객관적 세계의 일부 현상을 추상화하여 얻은 모델로, 객관적 세계를 추상화하고 단순화한 것이다. 공유는 온톨로지에 기술된 지식이 개인에게만 국한되지 않고 해당 분야에서 인정된다는 것을 의미한다. 명시적은 사용된 개념의 종류와 개념 사용에 대한 제약이 명확하게 정의된다는 것을 의미한다. 형식적은 온톨로지가 기계가 읽고 인간이 이해할 수 있다는 것을 의미한다.
요약하자면, 온톨로지는 해당 분야의 객체를 분석하고 객체 간의 관계를 파악함으로써 해당 분야의 사업을 명확하고 형식적으로 설명할 수 있습니다.
에게 비즈니스 메타데이터 관리 온톨로지를 통해 세 가지 핵심 사항에 주의를 기울여야 합니다. 온톨로지의 구성, 온톨로지의 저장, 온톨로지의 사용입니다.
1. 건설 – 메타데이터 관리를 사용하여 자동으로 온톨로지를 구성합니다.
온톨로지를 구축하는 전통적인 방법은 비즈니스 전문가의 제안에 따라 비즈니스 도메인의 온톨로지를 수동으로 분류하는 것입니다. 이 수동 분류 방법에는 일련의 문제가 있습니다.
- 효율성 문제: 빅데이터 환경에서 데이터는 복잡하고, 소스는 다양하며, 사업 분야는 계속 증가하고 있습니다. 수동 정렬 속도는 더 이상 기업의 요구를 충족시킬 수 없습니다.
- 도구 문제: 비즈니스 전문가는 자동화 기능이 있는 도구가 부족하여 많은 시간과 노력을 소모하는 복잡한 온톨로지를 구축하게 됩니다. 자원.
- 타사 데이터: 기업 전문가는 타사 데이터와 관련된 비즈니스를 이해하지 못하므로 관련 온톨로지 구축을 완료하는 데 어려움이 있습니다.
빅데이터 환경에서 기업은 온톨로지를 구축하는 새로운 방식이 필요합니다. 기업은 메타데이터 관리 도구를 통해 엔터프라이즈 애플리케이션 시스템과 다양한 문서에서 메타데이터를 자동으로 추출할 수 있으며, 온톨로지가 처음 형성된 후 2차 검토를 위해 비즈니스 전문가에게 인계되고, 마지막으로 엔터프라이즈 온톨로지 구축이 완료됩니다.
2. 보관 – OWL 사양 저장 온톨로지를 구현하기 위해 MOF를 기반으로 합니다.
온톨로지의 저장은 특정 표준에 기반해야 하며, 저장 방법은 유연하고 확장 가능해야 합니다. OWL 사양은 W3C에서 권장하는 사양이며 현재 널리 인정받는 온톨로지 저장 및 교환 사양입니다. 저희 메타데이터는 MOF에 기반하기 때문에 OWL 메타 모델을 메타 모델에 설정할 수 있으므로 메타데이터 데이터베이스에서 온톨로지의 저장 및 관리를 실현할 수 있습니다.
기술 메타데이터와 온톨로지가 모두 메타데이터 데이터베이스에 저장되어 있기 때문에 온톨로지는 원래 기술 메타데이터에서 추출되었습니다. 이런 방식으로 온톨로지와 기술 메타데이터 간의 관계를 쉽게 얻을 수 있으므로 비즈니스 담당자는 데이터 뒤에 있는 비즈니스 의미를 명확하게 이해할 수 있습니다.
3. 사용 – 비즈니스 메타데이터 서비스를 통해 비즈니스 컨텍스트를 얻습니다.
마지막으로, 비즈니스 메타데이터 서비스를 모든 비즈니스 담당자에게 제공하고, 비즈니스 담당자의 업무 환경에 내장하여 비즈니스 담당자가 비즈니스 관점에서 데이터를 빠르게 이해할 수 있도록 해야 하며, 이를 통해 비즈니스 담당자가 데이터를 보다 효과적으로 활용할 수 있도록 도와야 합니다.
4. 요약 및 전망
마지막으로 한 문장으로 요약하겠습니다. 비즈니스 메타데이터는 미래 메타데이터 관리의 핵심입니다. 빅데이터 시대에 기업은 비즈니스 메타데이터 관리를 강화해야 합니다. 기업은 자동화된 수단을 사용하여 온톨로지에 기반한 비즈니스 메타데이터를 관리하고 비즈니스 메타데이터를 통합할 수 있습니다. 데이터는 비즈니스 인력이 데이터를 더 잘 활용할 수 있도록 서비스 형태로 비즈니스 인력에게 제공됩니다.
결론
저희 기사를 읽어주셔서 감사합니다. 이 기사가 비즈니스 메타데이터 관리에 대한 더 나은 이해를 얻는 데 도움이 되기를 바랍니다. 메타데이터 관리에 대해 더 자세히 알고 싶으시다면 방문하시기를 권장합니다. Gudu SQLFlow 자세한 내용은.
그 중 하나로서 최고의 데이터 계보 도구 오늘날 시장에 출시된 Gudu SQLFlow는 SQL 스크립트 파일을 분석하고 데이터 계보를 얻고 시각적 표시를 수행할 뿐만 아니라 사용자가 다음을 제공할 수 있도록 합니다. 데이터 계보 CSV 형식으로 저장하고 시각적으로 표시합니다. (2022년 6월 30일 Ryan이 게시)
이 글을 재미있게 읽으셨다면 아래의 다른 기사도 읽어보세요.