マインドマップギャラリー DAMA-CDGA データ ガバナンス エンジニア - 10. 参照データとマスター データ
マスター データと参照データの管理により、組織が各プロセスで完全で一貫性のある最新かつ信頼できる参照データとマスター データを確実に保持できるようになり、標準および共通のデータ モデルと統合を採用することで、データ使用とデータ統合のコストが削減されます。モードと複雑さ。
2024-03-05 20:27:15 に編集されました10. 参照データとマスターデータ
導入
概要
1. マスターデータ:共有データについては、データ標準を確立してデータ品質を向上させます。
2. マスターデータの難しさ:マスターデータの見分け方
3. 見分け方
エンティティが共有されているかどうか
重要で比較的安定した属性
背景
どの組織にも、ビジネス領域、プロセス、システム全体で使用する必要があるデータが存在します。
このデータが共有されると、組織全体とその顧客に利益がもたらされます。
データ駆動型の組織活動は、トランザクション データ (売上や市場シェアの拡大、コストの削減、コンプライアンスの実証など) に焦点を当てることがよくありますが、そのようなトランザクション データを活用できるかどうかは、参照データとマスター データの可用性と品質に大きく依存します。
マスターデータ管理ドライバー
組織のデータニーズを満たす
組織内の複数のビジネス領域が同じデータ セットにアクセスする必要があり、これらのデータ セットが完全で最新で一貫性があると信頼しています。
マスターデータはこれらのデータセットの基礎です
データ品質の管理
マスター データ管理では、統一された ID を使用して組織にとって重要なエンティティを定義します。
データ統合コストを管理する
マスター データがなければ、すでに複雑な環境に新しいデータ ソースを統合するとコストが高くなります
これにより、主要なエンティティの定義および識別方法の変更によって生じる追加コストが削減されます。
リスクを軽減する
マスターデータによりデータ共有アーキテクチャが簡素化され、リスクが軽減されます。
リファレンスデータ管理ドライバー
一貫した参照データを使用することで、複数のプロジェクトのデータ ニーズを満たし、データ統合のリスクとコストを削減します。
データ品質の向上
目標
組織がすべてのプロセスにわたって、完全で一貫性のある最新かつ信頼できる参照データとマスター データを確実に保持するようにする
企業がさまざまなビジネスユニットおよびアプリケーションシステム間で参照データとマスターデータを共有することを奨励します。
標準の共通データ モデルと統合モードを採用することで、データ使用とデータ統合のコストと複雑さを軽減します。
原則として
データを共有する
組織内で参照データやマスタデータを共有するには、これらのデータを管理する必要があります
所有
参照データとマスターデータの所有権は、システムや部門ではなく組織に属する必要があります。
広く共有する必要があるため、グローバルな組織運営が必要
品質
参照データとマスターデータには継続的なデータ品質の監視と品質が必要です
管理責任
ビジネスデータ管理の専門家が参照データの品質を管理し保証する責任を負います
コントロールチェンジ
特定の時点でのマスター データの値は、何が正確で最新であるかについて組織が最もよく理解していることを表す必要があります。
データ値を変更するための一致ルールは、関連する監督の下で注意して使用する必要があります
マスターデータと参照データをマージまたは分割する操作はすべて追跡可能である必要があります
参照データへの変更は明確なプロセスに従う必要があります。変更は実装前に通知され、承認される必要があります。
権限
マスターデータ値は記録システムからのみコピーする必要があります
組織を超えたマスターデータの共有を実現するには、リファレンスデータ管理システムの構築が必要になる場合があります。
基本的な考え方
マスターデータと参照データの違い
メインデータ
マスター データでは、概念的エンティティのインスタンスごとに信頼できるインスタンスのバージョンを特定して開発し、そのバージョンの最新性を維持する必要があります。
マスター データに関する課題は、エンティティの解決です。これは、異なるシステムやプロセスからのデータ間の関連性を特定し、管理するプロセスです。
マスター データの各行で表されるエンティティとインスタンスは、システムごとに異なる表現を持ちます。
マスター データ管理は、これらの違いを解消し、さまざまな環境でも個々のエンティティとインスタンスを一貫して識別できるようにすることです。
これらのマスター データ エンティティとインスタンスの ID の一貫性を保つために、このプロセスを継続的に管理する必要があることに注意してください。
類似性
どちらも、データの意味を理解するために、トランザクション データの作成と使用に重要なコンテキスト情報を提供します (参照データはプライマリ データのコンテキストも提供します)。
どちらもエンタープライズ レベルで管理される共有リソースです
同じ参照データのインスタンスが複数あると効率が低下し、必然的にインスタンス間の不一致が生じ、不一致は曖昧さをもたらし、曖昧さは組織にリスクをもたらします。
違う
参照データは簡単には変更されず、そのデータ セットは通常、トランザクション データ セットやマスター データ セットよりも小さく、複雑さが少なく、列と行の数も少なくなります。
参照データ管理にはエンティティ解決の課題は含まれない
管理上の優先順位の違い
リファレンスデータの管理
定義されたドメイン値とその定義を制御する必要がある
目標は、組織が各コンセプトの正確かつ最新の値の完全なセットに確実にアクセスできるようにすることです。
マスターデータ管理
マスターデータの値と識別子は、中核事業体からの最も正確かつタイムリーなデータをシステム間で一貫して使用できるように管理する必要があります。
目標には、あいまいな識別子に関連するリスクを軽減しながら、現在の値の正確性と使いやすさを確保することが含まれます
参照データ管理における課題の 1 つは、参照データの定義と保守を誰が主導するか、または責任を負うかということです。
一部の参照データは、それを使用する組織外から取得されます。 これらは組織内の境界を越え、複数の部門によって所有されています。
その他の参照データは部門内で作成および維持される場合があります。 しかし、組織の他の部分でも潜在的な価値がある
データの取得と更新の管理に対する責任の特定は、参照データ管理の一部です
メンテナンスの責任が欠如していると、参照データの不一致がデータのコンテキストの誤解につながる可能性があるため、リスクが生じます。
マスター データと参照データはトランザクションにコンテキスト情報を提供するため、組織が運用される際に組織に取り込まれるトランザクション データを形成し、トランザクション データのフレームワーク分析をサポートします。
参照データ
他のデータを説明または分類したり、データを組織外の情報に接続したりするために使用できるあらゆるデータ
参照データ管理には、定義されたドメイン値、定義、およびドメイン値間の値の制御と保守が必要です
参照データ管理の目標は、さまざまな部門にわたって参照される値が一貫性があり、最新であり、組織内でアクセスできるようにすることです。
他のデータと同様、参照データにはメタデータが必要です
参照データの重要なメタデータ属性は、業界標準の参照データの管理団体などのソースです。
参照データ構造
リスト
最も単純な参照データは、コード値とコードの説明のリストです。
相互参照データ一覧
異なるアプリケーションは異なるコード セットを使用して同じ概念を表現できます
相互参照データセットはコード値間で変換可能
分類学
機密参照データ システムは、さまざまなレベルでの差異に基づいて情報を取得します。
カテゴリ参照データは再帰的な関係で保存可能
オントロジー
一部の組織では、Web サイトのコンテンツを管理するために使用されるオントロジーを参照データの一部として使用しています。これは、オントロジー モデルが他のデータを記述したり、組織のデータを組織の境界外の情報と関連付けたりするためにも使用されるためです。
オントロジー モデルはメタデータの形式として理解できます
オントロジーを維持するためのベスト プラクティスは、参照データ管理のベスト プラクティスと似ています。
オントロジーの主な使用例の 1 つはコンテンツ管理です。
独自のまたは内部参照データ
多くの組織は、内部プロセスとアプリケーションをサポートするために参照データを作成します。
業界参考データ
重要な概念をエンコードするための共通標準を提供する組織ではなく、業界団体や政府機関によって作成および維持されるデータ セットを記述するために使用されます。
たとえば、国際疾病分類コード (ICD) は、健康状態と治療法を分類するための共通の方法を提供します。
地理的または地球統計的参照データ
地理情報に基づいて分類または分析できる
たとえば、国勢調査局は、人口密度、過去の気象情報を厳密な地理的カテゴリに変換したことを報告します。
参考データの計算
多くの商業活動は、継続的に計算される共通のデータの使用に依存しています。
たとえば、外国為替の計算は、適切に管理された最新の為替レート表に依存しています。
計算参照データと他のタイプの参照データの主な違いは、データが変更される頻度です。
標準参照データセットのメタデータ
他のデータと同様、参照データも時間の経過とともに変化します
これはさまざまな組織で一般的に使用されるため、系統と流通プロセスを確実に理解して維持するために、参照データ セットに主要なデータを維持することが重要です。
メインデータ
マスター データは、ビジネス トランザクションと分析のためのコンテキスト情報を提供するビジネス エンティティに関するデータです。
実体は客観的な世界の物体です
エンティティは、データとレコードの形式のエンティティとインスタンスによって表されます。
マスターデータは、主要なビジネスエンティティに関連する信頼できる最も正確なデータを表す必要があります
記録システム、参照システム
異なるバージョンの「真実」が存在する場合、それらを区別する必要がある
これを行うには、データの出所やアクセス先、データが作成された具体的な用途と目的を知る必要があります。
記録システムは、定義されたルールと期待のセットを使用してデータを作成、取得、維持する権威あるシステムです。
参照システムは、情報が参照システムからのものでない場合でも、データ利用者は参照システムから信頼できるデータを取得してトランザクションや分析をサポートできます。
マスター データ管理アプリケーション MDM、データ共有センター DSH、データ ウェアハウス DW がリファレンス システムとしてよく使用されます。
信頼できる情報源、ゴールデンレコード
信頼できる情報源は「真実の最良のバージョン」とみなされます
信頼できるソースの中で、エンティティまたはインスタンスの最も正確なデータを表すレコードをゴールデン レコードと呼ぶことができます。
マスターデータ管理
マスター データ管理では、マスター データの値と識別子を制御することによってのみ、システム全体でコア ビジネス エンティティの最も正確かつタイムリーなデータの一貫した使用を保証できます。
目標には、曖昧な識別子のリスクを軽減しながら、正確な最新の値の可用性を確保することが含まれます。
ステップ
マスター データ エンティティの包括的なビューを提供する候補データ ソースを特定する
エンティティとインスタンスの正確な一致とマージのためのルールを開発する
適切に一致またはマージされていないデータを特定して回復する方法を確立する
信頼できるデータを企業全体のシステムに配布する方法を確立する
マスターデータ管理の主要な処理ステップ
データモデル管理
データ収集
データの検証、標準化、データの強化
エンティティ解決と識別子の管理
パーティマスターデータ
個人、組織、およびビジネス関係におけるそれらの役割に関するデータ
財務マスターデータ
ビジネスユニット、コストセンター、プロフィットセンター、総勘定元帳勘定科目、予算、計画、プロジェクトに関するデータが含まれます。
法定マスターデータ
契約、規制、その他の法的事項に関するデータが含まれます
製品マスターデータ
製品ライフサイクル管理PLM
製品データ管理 PDM
エンタープライズ リソース プランニングERP
製造実行システム MES
顧客関係管理 CRM
場所マスターデータ
地理情報を追跡および共有し、地理情報に基づいて階層またはマップを作成する機能を提供します。
業界マスターデータ -- 参照ディレクトリ
参照カタログは、組織が購入してトランザクションの基礎として使用できるマスター データ エンティティ (企業、人、製品など) の信頼できるリストです。
データ共有アーキテクチャ
レジストリ
レジストリは、さまざまな記録システムのマスター データ レコードへのインデックスです。
システム管理アプリケーションのローカルにマスター データを記録し、マスター インデックスに基づいてマスター データにアクセスします。
レジストリは記録システムへの変更がほとんど必要ないため、実装が比較的簡単です。
トレーディングセンター
このアプローチでは、各アプリケーションは中央システムと対話してマスター データにアクセスし、更新します。
マスターデータはトレーディングセンター内に存在し、他のアプリケーションには存在しません
トランザクション センターはマスター データの記録システムです
ブレンドモード
ハイブリッド モードはレジストリとトランザクション センターを組み合わせたものです
システム管理アプリケーションにローカルにマスターデータを記録する
マスターデータは共通リポジトリに統合され、データ共有センターを通じて共有されるため、記録システムから直接アクセスする必要がなくなります。
活動
マスターデータ管理活動
推進要因とニーズを特定する
データソースの評価と評価
アーキテクチャ的アプローチを定義する
マスターデータのモデリング
管理責任とメンテナンスプロセスを定義する
マスターデータの利活用を促進するガバナンス体制の確立
参照データ管理活動
推進要因とニーズを定義する
データソースを評価する
アーキテクチャ的アプローチを定義する
モデリング参照データ
管理責任とメンテナンスプロセスを定義する
リファレンスデータガバナンス体制の確立
ツールと方法
マスター データ管理は、データ統合ツール、データ修復ツール、運用データ ストレージ ODS、データ共有センター DSH、または特殊なマスター データ管理アプリケーションを通じて実現できます。
実装ガイド
マスターデータアーキテクチャに従う
組織全体でマスター データを管理および共有するには、適切なリファレンス アーキテクチャを確立して従うことが重要です。
データフローの検出
参照データとマスターデータの共有環境間でデータが流れるため、次の目的で関連するデータ フローを監視する必要があります。
組織全体でデータがどのように共有され、使用されるかを示す
管理システムおよびアプリケーション内のデータの系統を特定する
問題の根本原因分析を支援する
データ統合と消費統合技術の有効性を実証する
データ消費を通じてソース システムからのデータ値のレイテンシーを示す
統合コンポーネントで実行されるビジネス ルールと変換の有効性を判断する
参照データの変更を管理する
参照データの変更リクエストは確立されたプロセスに従う必要があります
データ共有契約
適切なアクセスと使用を確保するには、どのデータをどのような条件で共有できるかを規定する共有契約を確立する必要があります。
組織と文化の変化
参照データとマスターデータのガバナンス
ガバナンスプロセスの決定
メトリクス
データの品質とコンプライアンス
データ変更アクティビティ
データ共有環境におけるデータガバナンスを改善するには、信頼できるデータの系統を監査することが必要です
データの取得と消費
これらの指標は、どのシステムがデータに貢献しているのか、どのビジネス領域が共有環境でデータをサブスクライブしているのかを示し、追跡する必要があります。
サービスレベル契約
データ共有環境全体での使用と導入を確実にするために、SLA を確立し、寄稿者と加入者に通知する必要があります。
データ管理スペシャリストの対象範囲
これらの指標は、データ コンテンツの責任者またはチームに焦点を当て、カバレッジがどのくらいの頻度で測定されるかを示す必要があります。
総所有コスト
コストには、環境インフラストラクチャ、ソフトウェア ライセンス、サポート スタッフ、コンサルティング費用、トレーニングなどが含まれる場合があります。
データ共有量と使用量
データ環境の有効性を判断するには、マスター データに組み込まれたデータの量と使用状況を追跡する必要があります