メタデータ リポジトリとは

メタデータ リポジトリ 保存するために作成されたデータベースです メタデータ.メタデータは、実際のデータを含む構造に関する情報です。メタデータは「データに関するデータ」と考えられることがよくありますが、これは誤解を招きます。データ プロファイルは、実際の「データに関するデータ」の一例です。メタデータは、この定義に抽象化のレイヤーを追加します。これは、データを含む構造に関するデータです。メタデータは、任意の形式で保存された任意の主題に関する任意のデータの構造を記述することができます。

適切に設計されたメタデータ リポジトリには、多くの場合、さまざまなデータ構造の単純な定義をはるかに超えるデータが含まれています。典型的なリポジトリには、各データ構造に関する数十から数百の異なる情報が格納されています。

メタデータ リポジトリ

メタデータ リポジトリ

メタデータ リポジトリの定義:

メタデータ リポジトリは、メタデータの物理的な格納と分類を担当します。メタデータ リポジトリ内のデータは、一般的で、統合された、現在および過去のデータである必要があります。

汎用: メタモデルは、アプリケーション固有の定義済みの方法ではなく、汎用的な用語でメタデータを格納する必要があります。そのため、データベースの標準が製品ごとに変わっても、メタデータ リポジトリの物理メタモデルを変更する必要はありません。オールインワン メタデータ リポジトリの機能により、すべてのビジネス ドメインのメタデータを統合された方法で実行できます。つまり、組織のすべてのドメインとサブジェクト エリアをカバーします。メタデータ リポジトリには、現在および過去のメタデータにアクセスできる必要があります。メタデータ リポジトリは、以前はデータ ディクショナリと呼ばれていました。

ビジネス インテリジェンスでのメタデータの使用に対する需要が高まるにつれて、メタデータ リポジトリの範囲も拡大しています。古いデータ ディクショナリは、テクノロジがビジネスと相互作用する場所に最も近いものです。データディクショナリは、初期段階ではメタデータリポジトリの全領域ですが、範囲が拡大するにつれて、 ビジネス用語集 そして、ビジネス側に現れるさまざまな状態タグのタグが技術側に現れ、技術メタデータの消費、その系統と接続がリポジトリのソースになり、ビジネスとテクノロジーを結び付ける貴重なレポートが作成に役立ちます データ管理 意思決定を容易にし、変更のコストを評価します。

メタデータ リポジトリは企業全体を探索します データガバナンス, データ品質 マスターデータ管理 (マスターデータと参照データの両方) を統合し、この豊富な情報を組織全体の統合メタデータと統合して、さまざまなシステムから消費される構造のみを反映する場合でも、データ構造の意思決定支援システムを提供します。

リポジトリとレジストリ

リポジトリには、レジストリと比較して追加の機能があります。メタデータ リポジトリは、メタデータ レジストリなどのメタデータを格納するだけでなく、関連するリソースに関係を追加します。 メタデータの種類.組織に入ってから成果物に至るまでのフローに関連するメタデータは、そのデータ ポイントの系統と見なされます。

他の関連するメタデータ タイプに関連するメタデータは、リンクと呼ばれます。組織内のすべてのメタデータ ポイントに関連し、変更を処理するための整合性を維持するアーキテクチャを提供することにより、メタデータ リポジトリは、データの完全なフロー、その定義、およびその影響を理解するための基本的な資料を提供します。同様に重要な機能は、バージョン管理を維持することですが、この比較ステートメントについては議論の余地があります。これらの定義はまだ開発中であるため、定義の精度を向上させる必要があります。

レジストリの目的は、メタデータ要素を定義し、組織全体で維持することです。データ モデルおよびその他のデータ管理チームは、変更についてレジストリを参照します。メタデータ リポジトリは、組織内のさまざまなメタデータ システムからメタデータを取得し、上流のコンテンツを反映します。リポジトリがアップストリームとして機能することはありませんが、レジストリはメタデータの変更のアップストリームとして使用されます。

Metadata Repository を使用する理由:

メタデータ リポジトリを使用すると、組織のデータ コンテナーのすべての構造を 1 つの統合された場所に統合できます。これにより、計算されたビジネス上の意思決定を行うための豊富なリソース情報が開かれます。このツールは、共通形式のデータ モデルを使用してすべてのモデルを統合し、組織のすべてのアプリケーションとプログラムを 1 つの形式にまとめます。

最も重要なことは、ビジネス定義とビジネス プロセスを適用することで、ビジネスとテクノロジーをより緊密に結び付けることができ、組織が明確な目標を持つ堅実なロードマップを策定するのに役立つことです。ワンストップの情報により、企業は変更をより詳細に制御し、ツールの影響分析を実行できます。

多くの場合、企業は多くの時間と費用を費やして、調査結果と影響に関する調査に基づいて意思決定を行い、変更を加えたり、新しいデータ構造を追加したり、組織のデータ管理から構造を削除したりします。適切に構造化され、適切に管理されたリポジトリを使用すると、製品をアイデアから納品まで移動するのに必要な時間が最小限に抑えられます (他の変数が一定であることを考慮すると)。

メタデータ リポジトリの設計

各データベース管理システム (DBMS) およびデータベース ツールには、メタデータ コンポーネント用の独自の言語があります。データベース アプリケーションには、格納されているデータにアクセスするために必要なすべての機能を提供することが期待される独自のリポジトリまたはレジストリが既にあります。ベンダーは、他社が自社の製品から競合他社の製品にデータを簡単に移行できることを望んでいないため、メタデータの処理はベンダー独自のものです。 CASE ツール、DBMS 辞書、 ETL ツール、データ クリーニング ツール、OLAP ツール、および データマイニング ツールはすべて、さまざまな方法でメタデータを処理および保存します。これらすべてのツールのメタデータ コンポーネントを格納するように設計できるメタデータ リポジトリは 1 つだけです。

メタデータ リポジトリは、所有権、記述的特性、ルールとポリシー、および物理的特性の 4 つのカテゴリにメタデータを格納する必要があります。所有権。データ所有者とアプリケーション所有者を示します。記述的特性は、名前、タイプ、長さ、およびビジネス データまたはビジネス プロセスを記述する定義を定義します。ルールとポリシーは、セキュリティ、データのクリーン度、データのタイムライン、および関係を定義します。物理的特性は、ソースまたは起点と物理的な場所を定義します。

データベースを作成するために論理データ モデルを構築するのと同じように、論理メタモデルは、ビジネス データのメタデータ要件を特定するのに役立ちます。メタデータ リポジトリは、集中型、分散型、または分散型になります。

一元化された設計とは、ビジネス全体のすべてのアプリケーションのメタデータを格納するメタデータ リポジトリのデータベースを提供することを意味します。集中型メタデータ リポジトリには、集中型データベースと同じ機能があります。すべてのデータが 1 つのデータベースにあるため管理は簡単ですが、ボトルネックが発生する可能性があるという欠点があります。

分散型メタデータ リポジトリは、メタデータを場所やビジネス ユニットごとに分けられた複数のデータベースに保存します。これにより、一元化されたメタデータ リポジトリに比べてリポジトリの管理が複雑になりますが、メタデータを部門に分割できるという利点があります。

分散メタデータ リポジトリは分散型アプローチを使用しますが、分散型メタデータ リポジトリとは異なり、メタデータは元のアプリケーションに残ります。

結論

この記事をお読みいただきありがとうございます。この記事がメタデータ リポジトリの理解を深めるのに役立つことを願っています。メタデータ リポジトリについて詳しく知りたい場合は、次のサイトにアクセスすることをお勧めします。 Gudu SQLFlow 詳細については。その一つとして 最高のデータ系統ツール 現在市場に出回っている Gudu SQLFlow は、SQL スクリプト ファイルを分析し、データ系統を取得して視覚的に表示できるだけでなく、ユーザーがデータ系統を CSV 形式で提供し、視覚的に表示することもできます。 (2022 年 7 月 2 日に Ryan により公開)

Gudu SQLFlow Live を試す

SQLFlow クラウド バージョン

週刊ニュースレターを購読する

コメントを残す