데이터마트란?
에이 데이터마트 특정 전문가 그룹을 대상으로 하는 운영 데이터 및 기타 데이터 소스에서 데이터를 수집하는 창고입니다. 범위 측면에서 데이터는 전사적 데이터베이스 또는 보다 전문화된 데이터베이스에서 추출됩니다. 데이터웨어하우스. 데이터 센터의 요점은 분석, 콘텐츠, 성능 및 사용 편의성 측면에서 전문 사용자 그룹의 특정 요구 사항을 충족한다는 것입니다. 데이터 센터 사용자는 데이터가 익숙한 용어로 표현되기를 기대합니다.
데이터마트 대 데이터웨어하우스:
데이터웨어하우스는 DSS(의사결정 지원 시스템) 기능을 지원하도록 설계된 통합된 주제 중심의 데이터 모음입니다. 데이터웨어하우스에서 각 데이터 단위는 특정 시간과 연관됩니다. 원자 수준 데이터와 가볍게 집계된 데이터로 구성된 데이터웨어하우스는 비즈니스 관리에서 의사 결정 프로세스를 지원하기 위한 주제 중심의 통합된 업데이트 불가능한(안정적인) 시간 가변 데이터 모음입니다.

데이터마트 대 데이터웨어하우스
그러면 데이터 마트는 주로 부서 수준의 비즈니스에 초점을 맞추고 특정 주제에만 초점을 맞춘 엔터프라이즈 수준 데이터 웨어하우스의 하위 집합입니다. 유연성과 성능 간의 모순을 해결하기 위해 데이터 마트는 데이터 웨어하우스 아키텍처에 추가된 소규모 부서 또는 작업 그룹 수준의 데이터 웨어하우스입니다. 데이터 마트는 특정 사용자의 성능 요구 사항을 충족하기 위해 미리 계산된 데이터를 저장합니다. 데이터 웨어하우스에 액세스하는 병목 현상을 어느 정도 완화할 수 있습니다.
데이터마트 특성:
- 크기가 작음
- 특정한 응용 프로그램이 있습니다.
- 부서 중심의;
- 사업부에서 정의, 설계 및 개발됨
- 사업부에서 관리 및 유지 관리함
- 빠르게 구현될 수 있습니다.
- 구매 비용이 더 저렴하다;
- 빠른 투자 회수
- 툴셋의 긴밀한 통합
- 데이터 웨어하우스의 더욱 자세하고 기존의 요약 하위 집합을 제공합니다.
- 전체 데이터 웨어하우스로 업그레이드 가능
데이터 마트의 데이터 구조:
데이터 마트에서 데이터 구조는 종종 별 또는 눈송이 구조로 설명됩니다. 별 구조는 팩트 테이블과 다양한 지원 차원 테이블이라는 두 가지 기본 부분으로 구성됩니다.
1.에프act 테이블
팩트 테이블은 데이터 마트에서 가장 밀도가 높은 데이터를 설명합니다. 전화 회사에서는 통화에 사용되는 데이터가 일반적으로 가장 밀도가 높습니다. 은행에서는 조정 및 ATM(자동화 현금 인출기)과 관련된 데이터가 일반적으로 가장 집약적입니다. 소매의 경우 판매 및 재고 데이터가 가장 밀도가 높습니다.
팩트 테이블은 주문, 판매, 전화 통화 등과 같이 팩트 테이블의 목적을 반영하는 엔터티의 기본 키, 기본 키 정보, 팩트 테이블을 차원 테이블에 연결하는 외래 키, 외래 키에 의해 전달되는 키가 아닌 외부 데이터를 포함하여 미리 결합된 여러 유형의 데이터의 조합입니다.
이 비핵심 외부 데이터가 자주 사용되는 경우 데이터 분석 사실 테이블에서 사실 테이블의 범위에 포함됩니다. 사실 테이블은 고도로 인덱싱됩니다. 사실 테이블에 30~40개의 인덱스가 있는 것은 매우 일반적입니다. 때때로 사실 테이블의 각 열이 인덱싱되고 그 결과 사실 테이블의 데이터를 읽기가 매우 쉽습니다. 그러나 자원 인덱스를 가져오는 데 필요한 것은 방정식에 반영되어야 합니다. 일반적으로 팩트 테이블 데이터는 변경할 수 없지만 데이터는 입력할 수 있으며 레코드를 올바르게 입력하면 해당 레코드에 대해 아무것도 변경할 수 없습니다.
2. 차원표
차원 테이블은 팩트 테이블을 중심으로 구축됩니다. 차원 테이블에는 외래 키를 통해 팩트 테이블에 연결된 비집중적 데이터가 포함됩니다. 일반적인 차원 테이블은 제품 카탈로그, 고객 목록, 공급업체 목록 등을 포함한 데이터 마트를 기반으로 합니다.
데이터 마트의 데이터는 엔터프라이즈 데이터 웨어하우스에서 나옵니다. 한 가지 예외를 제외하고 모든 데이터는 데이터 마트로 가져오기 전에 엔터프라이즈 데이터 웨어하우스를 거쳐야 합니다. 이에 대한 예외는 데이터 마트에서 사용되는 특정 데이터로, 데이터 웨어하우스의 다른 곳에서는 사용할 수 없습니다. 외부 데이터는 일반적으로 이 범주에 속합니다. 그렇지 않고 데이터가 의사 결정 지원 시스템의 다른 곳에서 사용되는 경우, 데이터는 엔터프라이즈 데이터 웨어하우스를 거쳐야 합니다.
데이터마트에는 일반적으로 두 가지 유형의 데이터가 포함됩니다. 자세한 데이터 그리고 집계된 데이터.
1. 자세한 데이터
앞서 설명한 대로, 데이터 마트에 있는 자세한 데이터는 스타 구조로 포함되어 있습니다. 스타 스키마는 데이터가 엔터프라이즈 데이터 웨어하우스를 통과할 때 잘 집계된다는 점을 언급할 가치가 있습니다. 이 경우 엔터프라이즈 데이터 웨어하우스는 필요한 기본 데이터를 포함하고 데이터 마트에는 더 높은 간격 크기의 데이터가 포함됩니다. 그러나 데이터 마트 사용자의 마음속에서 스타 구조 데이터는 획득했을 때와 마찬가지로 자세합니다.
2. 집계된 데이터
데이터 마트에 포함된 두 번째 유형의 데이터는 집계된 데이터입니다. 분석가는 일반적으로 스타 스키마의 데이터에서 다양한 집계된 데이터를 만듭니다. 일반적인 롤업은 판매 지역의 총 월간 매출일 수 있습니다. 집계의 기반이 끊임없이 진화하기 때문에 과거 데이터는 데이터 마트에 있습니다. 그러나 이 과거 데이터의 장점은 저장하는 일반화 수준에 있습니다. 스타 스키마에 보관되는 과거 데이터는 매우 적습니다.
데이터 마트는 엔터프라이즈 데이터 웨어하우스를 기반으로 업데이트됩니다. 일주일에 한 번 정도 업데이트되는 것은 드문 일이 아닙니다. 그러나 데이터 마트의 업데이트 시간은 1주일 미만이거나 1주일 초과일 수 있으며, 이는 주로 데이터 마트가 속한 부서의 요구 사항에 따라 결정됩니다.
데이터마트 유형:
1. 독립적
독립 데이터 마트의 데이터는 특수 사용자의 요구를 충족하기 위해 구축된 분석 환경인 운영 데이터베이스에서 나옵니다. 이러한 종류의 데이터 마트의 개발 주기는 일반적으로 짧고 유연하지만 데이터 웨어하우스와 분리되어 있기 때문에 독립 데이터 마트는 정보 섬이 존재하게 될 수 있으며 데이터를 글로벌 관점에서 분석할 수 없습니다.
2. 종속적
종속 데이터마트의 데이터는 기업의 데이터웨어하우스에서 나오므로 개발주기가 길어지지만 종속 데이터마트는 독립 데이터마트보다 아키텍처가 안정적이어서 개발주기를 단축시킬 수 있다. 데이터의 품질 분석을 통해 데이터 일관성을 보장합니다.
데이터마트의 장점:
- 이는 소량의 데이터만 처리하면 되는 데이터웨어하우스에 가장 비용 효율적인 대안 중 하나입니다.
- 데이터를 소스에서 분리하면 특정 그룹의 사람들이 데이터 웨어하우스를 모두 사용하는 대신 특정 소스의 데이터를 다룰 수 있으므로 데이터 마트의 효율성이 높아집니다.
- 어떤 하위 집합에 접근해야 하는지 알고 있다면 데이터 마트를 사용하여 데이터에 더 빠르게 접근할 수 있습니다.
- 사용이 더 쉬워서 최종 사용자가 쉽게 쿼리할 수 있습니다.
- 데이터가 그룹으로 분리되어 있으므로 데이터웨어하우스보다 구현 시점 데이터마트에 입력하는 데 걸리는 시간이 짧습니다.
- 특정 주제의 과거 데이터를 사용하여 쉬운 추세 분석이 가능합니다.
데이터마트 구현 단계:
1단계. 디자인:
이는 구현의 첫 번째 단계이며, 기술 및 비즈니스 정보를 수집하는 데 필요한 모든 작업과 소스를 식별합니다. 논리적 계획은 나중에 구현되고 검토 후 물리적 계획으로 변환됩니다. 또한 여기서 데이터의 논리적 및 물리적 구조가 결정됩니다. 예를 들어 데이터를 분할하는 방법과 날짜 또는 다른 파일과 같은 필드를 분할하는 방법이 결정됩니다.
2단계. 건설:
이것은 구현의 두 번째 단계이며, RDBMS의 도움으로 물리적 데이터베이스를 생성하는 것은 설계 프로세스와 논리적 구조의 일부로 결정됩니다. 스키마, 인덱스, 테이블, 뷰 등과 같은 모든 객체를 만듭니다.
3단계. 채우기:
이것은 세 번째 단계로, 데이터를 가져오면서 데이터를 채웁니다. 데이터가 채워지기 전에 모든 필수 변환이 구현됩니다.
4단계. 접근:
이것은 구현의 다음 단계이며, 채워진 데이터를 사용하여 보고서를 만들기 위한 쿼리를 실행합니다. 최종 사용자는 이 단계를 사용하여 쿼리를 사용하여 데이터를 이해합니다.
5단계. 관리:
이는 데이터 마트 구현의 마지막 단계로, 액세스 관리, 시스템 최적화 및 튜닝, 데이터 마트에 새 데이터 관리 및 추가, 모든 실패 시나리오를 처리하기 위한 복구 시나리오 계획 등의 작업이 여기서 처리됩니다.
결론
저희 기사를 읽어주셔서 감사합니다. 재미있게 읽으셨기를 바랍니다. 더 자세히 알고 싶으시다면 데이터 거버넌스, 방문하시기를 권장드립니다. Gudu SQLFlow 자세한 내용은.
그 중 하나로서 최고의 데이터 계보 도구 오늘날 시장에 출시된 Gudu SQLFlow는 SQL 스크립트 파일을 분석하고 얻을 수 있을 뿐만 아니라 데이터 계보, 시각적 표시를 수행할 뿐만 아니라, 사용자가 CSV 형식으로 데이터 계보를 제공하고 시각적 표시를 수행할 수 있도록 합니다. (2022년 6월 22일 Ryan이 게시)
One Comment
Leave A Comment
이 글을 재미있게 읽으셨다면 아래의 다른 기사도 읽어보세요.
[…] 그리고 마케팅 부서는 고객과 같은 소스로부터 데이터를 수집하기 위해 데이터 마트를 사용합니다.