データマネージメント (1)
以前の投稿記事(DXにおけるデータとシステムの役割)で、データマネージメントの必要性と、DAMAの「Data Management Body of Knowledge」第二版(MDBOK2)を紹介しました。データマネージメントとは具体的にはどういうことなのかをDMBOK2の内容に沿って、何回かに分けて書いていきます。
まずはDMBOK2に書かれている11の知識領域を概観する図を書いてみました。
こんな感じです。順番に説明していきます。
1 データガバナンス
データガバナンスとは、データを資産として管理することであり、その組織にとって重要な資産であるデータをいかに価値あるものにするか(あるいは価値を維持するか)を考え実行することです。このために以下のような活動を行います。
- 戦略の策定
- ポリシーの制定
- 標準の制定
- 品質の確保
- 監督
- 課題管理
- データ資産評価
データガバナンスは一度限りのことではなく、組織として継続的に行うものです。DMBOK2では、そのために必要な運営組織についても書かれています。この中には、データマネージメントはITシステムのマネージメントと分離した組織とすることが書かれています。最高情報責任者(CIO)とは別に最高データ責任者(CDO)をおき、個々の業務領域ごとにデータの作成・管理や標準化などの実効責任をもつ「データスチュアード」を置くなどの職務や役割の考え方が含まれています。
2 データアーキテクチャ
データアーキテクチャとは、データに対するビジネスサイドのニーズから必要なデータ要件を洗い出し、これを満たすシステムやデータの流れを設計したものです。この設計の過程で、以下にを明らかにします。
- ビジネスを行う上で必要なデータは何か
- 必要なデータは、どこからやってくるのか、どうやって取得するのか
- そのデータはどのように流れ、どこに格納されるのか
これを実現するための、設計の考え方、設計思想を定め、設計の成果は、エンタープライズデータモデルとデータフロー(データと業務の関連)などに表されます。エンタープライズデータモデルの例を以下に示します。
「エンタープライズ」という名前がついているますが、これは、企業の中のデータのモデリングに限定した話ではありません。企業や組織をまたがる、例えばMaaS(Mobility as a service)に関する事業などでも、以下のようなモデリングが必要になります。
3 データモデリングとデザイン
データモデリングは、「データを構造的に整理し、ビジュアルなモデルに表現することにより、データを効率的に扱えるようにすること」を意味します。データベース設計とほぼ同じ意味です。一般的に、その設計の成果はエンティティ、属性、関連(リレーション)を定義したER図として表されます。また、それに付随したデータディクショナリも成果物となます。データベースの設計は、「概念設計」、「論理設計」、「物理設計」の3段階で行われ、より抽象的なモデルから具体的なモデルへと段階を踏んでいきます。
概念設計
実際のデータベースの実装はあまり考慮せず、システムに必要なエンティティとエンティティどうしの関係を洗い出します。
論理設計
概念設計で洗い出したエンティティを整理し、各エンティティが持つべき属性を洗い出します。この際に、データの重複をなくし、整合をとるために「正規化」と呼ばれるデータの整理を行います。
物理設計
実際にデータを格納するDBMSやDWHに合わせた設計を行います。各エンティティや属性の名前・形式を決定、主キーの設定、インデックスの設定などを行います。(注:DMBOK2では、物理設計については次の「データストレージとオペレーション」の章の中で記載されています。)
4 データストレージとオペレーション
データを格納するストレージに関する事項です。どのようなデータベース製品を使ってデータを格納するのか、それをどのように運用していくかというデータを扱うシステムに関する話が中心になります。データの設計、実装には以下の要素が含まれます。
- データベースアーキテクチャ(リレーショナルデータベース、非リレーショナルデータベースなど)
- 使う技術(製品)の評価と選定
- 本番環境、開発環境、試験環境の用意
- 最大容量と増加の予測
- 可用性の確保方法の決定(リプリケーション、障害発生時の切替えなど)
- 実際のデータの取り込み(データ移行を含む)
データの運用(サポート)には以下の要素が含まれます。
- 性能やサイズの監視と管理
- 定常的なデータの取込み
- データベース設計、設定の変更
- バックアップの作成
- 障害時の復旧
これらの活動の責任者として、データベースアドミニストレータ(DBA=Database Administrators)を置くことが必要であり、活動のための組織が必要とされています。
5 データセキュリティ
システム内のデータが破壊されたり盗まれたりするのを防ぐために用いられる、一連の対策に関する事項です。その活動には、以下の要素が含まれます。
- システム要件からセキュリティポリシーの策定
- データに対する適切な認証と権限付与
- 権限に応じたデータに対するアクセスの制限
- 監査
- システムの監視
「6 データ統合と相互運用」以降は、次回の投稿で説明します。
“データマネージメント (1)” に対して1件のコメントがあります。