メタデータ管理 101
“メタデータ管理 エンタープライズ データ ガバナンスの基盤です」、これは実装時によく耳にするフレーズです。 データガバナンス 戦略。エンタープライズ マネージャー、IT 担当者、またはデータ業界の実務者として、データ ガバナンスを理解するための主なタスクは、メタデータとメタデータ管理を理解することです。この記事では、メタデータの概念を整理し、組織におけるメタデータ管理の役割を理解できるようにします。

メタデータ管理
メタデータとは
簡単に言えば、メタデータはデータに関するデータです。ソースでデータがキャプチャされるたびに、メタデータが生成されます。メタデータはユーザーがアクセスでき、組織内で移動でき、他のソースからの他のデータと統合または拡張でき、構成、クリーニング、および分析できます。メタデータは、戦略的な運用上の決定を導くために使用できるデータ要素の属性に関する情報を提供するため、非常に貴重です。
メタデータは何をしますか?
- あらゆる種類の複雑でさまざまな情報を統合するために使用されます。
- それが定義するセマンティック レイヤーは、エンド ユーザーがシステムに保存されているデータを分解するのに役立ちます。
- 要件の動的な変化とシステムのパフォーマンス (インターフェース) の柔軟性をサポートします。
- データの品質を向上させ、保証します。
- さまざまなツールの開発と適用をサポートします。
- システムのセキュリティを向上させます。
- システムのインテリジェンスを向上させます。
メタデータ管理とは
メタデータ管理は、その名の通り、メタデータの収集と管理です。 インターネットの発展に伴い、企業が毎年収集して使用するデータは、近年指数関数的に増加しています。 多くのエンタープライズ ビッグ データ環境のデータ形式は多様であり、標準は統一されていません。これらのさまざまな種類のデータを収集、配布、共有することは困難です。 これにより、企業はこれらのデータの統一された標準的な管理と制御、つまりメタデータ管理を実行することが必然的に必要になります。
ビジネスに対するメタデータ管理の利点は何ですか?
メタデータ管理により、企業は次の利点を得ることができます。
- データ品質の向上: 統合されたデータ ソースまたはターゲットのデータの問題と不整合をリアルタイムで発見し、洞察と修正時間を増やすことで、全体的なデータ品質を向上させます。
- 洞察を得るまでの時間を短縮する: 現在の 85/15 ルールを逆転させます。現在の 85/15 ルールでは、高給取りのメンタル ワーカーは、ソース データを実際に分析せずにエラーや矛盾を見つけ、理解し、解決することに忙殺されています。
- 規制遵守: GDPR、HIPAA、PII、BCBS、CCPA などの規制にはすべて、データのプライバシーとセキュリティの要件があるため、機密データにタグを付け、その情報を文書化する必要があります。 データ系統、トレーサビリティのための流れを説明します。
- デジタル トランスフォーメーション: 存在するデータとその価値の可能性を理解することで、デジタル エクスペリエンスを強化し、デジタル オペレーションを強化し、デジタル イノベーションを推進し、デジタル エコシステムを構築することで、デジタル トランスフォーメーションを促進できます。
- エンタープライズ コラボレーション: ビジネス ユニットは、データ ガバナンスと企業の戦略的目標との間の調整を推進します。一方、IT はデータ管理の技術的な運用を処理し、データを発見、信頼、使用して組織の目標を効果的に達成するための扉を開きます。
- 作業効率の向上とコストの削減: 自動化された反復可能なメタデータ管理プロセスに頼ることができれば、生産性が向上します。レポートによると、コーディングの効率は 85% 以上、メタデータの発見の効率は 70% 以上、データ設計の効率は 50% 以上、データ変換の効率は 70% 以上、のデータ マッピングが 80% 増加しました。
- プロジェクトの提供を加速する: ビッグ データの展開、データ ボールト、データ ウェアハウスのモダナイゼーション、クラウド移行などを最大 70% 高速化します。
メタデータ管理が非常に難しいのはなぜですか?
基礎となるメタデータの企業全体のビューを作成および維持し、簡単にアクセスできるようにすることは、いくつかの理由から複雑です。
- 現在、多数のデータ タイプとデータ ソースが存在しますが、これらは連携するようには設計されていません。
- 役割別およびワークフロー全体でのデータ アクセスを定義および制御するためのポリシー、プロセス、およびツールの欠如。
- データ インフラストラクチャは、ダウンストリームの統合をほとんど考慮せずに、さまざまなテクノロジと貧弱なドキュメントの寄せ集めです。
- 従来の手動の方法は、コストと時間がかかり、エラーが発生しやすく、動的なエンタープライズ データ管理インフラストラクチャの進化についていくことができません。
- ビジネス コンテキストが限定的または欠落している、一般的な用語が標準化されておらず、企業全体で採用されていない。
その結果、堅牢なデータ インフラストラクチャに依存するアプリケーションやイニシアチブが侵害され、分析や洞察にエラーが発生する可能性があります。分析ツールを十分に活用しなければ、組織はデータ駆動型の組織になることはできません。さらに悪いことに、逆の結果になる可能性もあります。
メタデータ管理プラットフォーム アーキテクチャの特徴は何ですか?
- メタデータ収集サービス: 異種環境に適応でき、従来のリレーショナル データベースとビッグ データ プラットフォームから、システム アプリケーションを生成するために収集されたデータからデータ処理システム レポート システムのデータを含む全量のメタデータをサポートします。エンティティのプロセス (システム、ライブラリ、テーブル、フィールドの説明) およびデータ エンティティ処理プロセスのロジック。
- メタデータ アクセス サービス: メタデータ アクセス サービスは、メタデータ管理ソフトウェアによって提供されるインターフェイス サービスです。通常、REST や Webservice などのインターフェース プロトコルをサポートします。メタデータ アクセス サービスは、エンタープライズ データ ガバナンスの基盤となるエンタープライズ メタデータの共有をサポートします。
- メタデータ管理サービス: モデル定義とメタデータの保存を実現し、機能層でさまざまなメタデータ機能にパッケージ化し、最終的に外部アプリケーションと表示を提供します。メタデータの分類とモデリング、データ系統と影響分析を提供し、データの追跡と振り返りを容易にします。
- メタデータ分析サービス: メタデータのアプリケーションには、通常、データ マップ、データ系統、影響分析、およびフルチェーン分析が含まれます。
結論
この記事をお読みいただきありがとうございます。この記事が、メタデータ管理についての理解を深めるのに役立つことを願っています。データ管理について詳しく知りたい場合は、次のサイトにアクセスすることをお勧めします。 Gudu SQLFlow 詳細については。
その一つとして 最高のデータ系統ツール 現在市場に出回っている Gudu SQLFlow は、SQL スクリプト ファイルを分析し、データ系統を取得し、視覚的に表示するだけでなく、ユーザーがデータ系統を CSV 形式で提供し、視覚的に表示することもできます。 (2022 年 5 月 28 日に Ryan により公開)
1 つのコメント
コメントを残す
これを読んで楽しんでいる場合は、以下の他の記事をご覧ください。
[…] ビッグデータ環境では、企業がさまざまな複雑な情報をメタデータ管理によって管理しなければ、情報を有効に活用することは困難です。しかし、多くの企業は徐々に […]