この記事は、データマネジメントとは何か?についてわかりやすく全体像を解説します。これらを読むことで、データマネジメントの必要性や目的がわかるようになります。
また、本記事は、私の経験に基づいて記載していますが、基礎的な知識についてはデータマネジメント知識体系ガイド 第二版(DMBOK2)を参考にしています。最初は章ごとに読み込んだり、後ほど必要になった際に参考にすると良いと思います。
そもそも、データマネジメントとは?
データマネジメントってなんでしょうか?どのような意味を持っているのでしょうか。
データマネジメントの字面だけ読んでも、「データをマネジメント(管理)する」くらいにしか見えないと思います。(実際、私はそうでした。)
データマネジメントの知識を体系立てまとめてある「データマネジメント知識体型ガイド-第二版」(DMBOK2)※1には、下記のように記されています。
データとインフォメーションという資産の価値を提供し、管理し、守り、高めるために、それらのライフサイクルを通して計画、方針、スケジュール、手順などを開発、実施、監督することである。
DMBOK2 – 第1章 データマネジメント イントロダクションより
読んでも、分かりづらいですね。
要約すると、下記のようなことを言っています。
- データ(インフォメーション含む)は、資産であり、そこに価値があると考えている。
- これらの資産の価値を守り、高め、提供し続けることが必要である。
- そのためにライフサイクルを通して、やることがある。
まとめると、データ資産から生み出される価値を高め続ける(下がらないように守る)ために管理すること。でしょうか。
※1 この本自体は600ページを超える大作で、最初から読み進めるのは無理があります。
なぜ、データマネジメントが必要なのか?
そもそもですが、なぜデータマネジメントが必要なのでしょうか。管理すると何かいいことがあるのでしょうか?
データの価値
データは、将来価値を生むべき資産であり、新しい原油という発言も聞きます。このデータを上手く使いこなすことが、企業の生命線になっています。(DXもデータを有効的に活用できるかが、ポイントになっています。)
こちらの、アクセンチュアさんの2021年IEB第2回テーマ会議「データ活用をいかに加速するか」2021.11.25という記事によると、「データ流通量と実質GDPの間には正の相関がある」と記されていることから、データ活用は経済効果を生むことが明らかにかと思います。
ビジネス上の意義
上記から分かる通り、資産であるデータをもっているだけで、優れた意思決定が下せるなど他社との差別化ポイントであり、競争優位性を生み出します。
反対に、不完全で品質が低く、信頼性の低いデータしかもっていない場合には、不利な状況に置かれます。
そのため、データマネジメントの失敗は、企業の資本の管理に失敗することと同じになりチャンスを見逃すことになるため、データをマネジメントすることは、企業が財務や物理的資産を管理することと同様に、重要なことと考えられます。
データマネジメントの目指すゴールとは?
データマネジメントが目指すべきゴールとは何でしょうか。どのような状態になっていればデータマネジメントは成功したと言えるのでしょうか。
DMBOK2には、下記のように記されています。
- 自社、お客様、従業員、ビジネスパートナーを含むステークホルダーの情報ニーズを理解しサポートすること。
- データ資産を取得し、保管し、保護し、健全性を担保する
- データとインフォメーションの品質を担保する
- ステークホルダーが保有するデータのプライバシーと機密性を確保する。
- 不正または不適切なデータとインフォメーションへのアクセス、操作・使用を防止する。
- 企業が付加価値を創造するためにデータを効果的に利用できるようにする。
データとインフォメーション
ここまでで、データとインフォメーションという用語が出てきました。ここではそれぞれの言葉の意味を定義し、また関連する用語についてもDIKWピラミッドを引用して解説します。
DIKWとは
DIKWは、データを使える知識・知恵にするためのフレームワークであり、下記の頭文字をとっています。使い方としては、それぞれのレイヤを明確に分けて共通言語とする。または上下のレイヤを移動することで、データを知恵に結びつけたり、源泉に辿ったりする。
- Data (データ)
- Information(情報)
- Knowledge(知識)
- Wisdom(知恵)
Data
数値、文章、音声、動画などの素材。意味を持たないもの。
Information
データ(Data)を整理、意味づけすることで解釈した状態とするもの。
Knowledge
情報(Information)を分析・体系化したもの。
Wisdom
知識(Knowledge)を体験で身につけた、洞察や問題解決力。
データマネジメントにおけるデータとインフォメーション
下記のことから、データとインフォメーションはDMBOKでは同列で扱っています。
- データは、存在しないこともあり、データを生成する必要がある。
- DIKWピラミッドに照らし合わせた場合、下記の順に昇華していくが、データを生成するKnowledge(知識)が必要である。(循環している)
- データとインフォメーションは深く絡み合っており、互いに依存している。データがインフォメーションの形になったり、インフォメーションがデータの形になる。
データマネジメントの原理原則
上述した通り、データマネジメントは、企業の他の資産と同様に管理が必要になります。管理とは、どのようなデータがあり、それで何をしているのか。データ資産をどのように扱えば組織目標が達成するか明らかにする必要があります。
データマネジメントは戦略上のニーズと業務上のニーズのバランスを取り、データマネジメントならではの特徴を捉えた原理原則を下記に記します。
- データは特有の性質を持つ資産
- 金銭や物理的な資産と異なり、使用しても失われない。
- データの価値は経済的観点で評価可能、評価されるべき
- データの定性的、定量的な価値を測定する手法はあるが基準は定まっていない。
- データの価値を向上させるには、価値を定量化する一貫した手法を考える必要がある。
- 高品質のデータから得る利益と、低品質のデータに係るコストの両方を測定する。
- データ管理はデータ品質の管理
- データが目的に沿っていることを保証することが、データマネジメントの主な目標である。
- データ品質を管理するには、ステークホルダーの品質要求事項を理解し、データがその要求に答えているかどうかを測定する。
- データ管理には、メタデータが必要
- データは手にとったり触れたりできないため、データの内容と使い方を理解するためにはメタデータが必要
- メータデータは、データを生成、処理、使用する様々なプロセスの中で生まれる。
- データマネジメントは予め計画が必要
- データは、様々なところで生み出されて、部門間を移動しながら利用される。
- 望み通りの結果を得たければ、アーキテクチャやプロセスの観点から計画を立てる必要がある。
- データマネジメントは機能横断的な活動で幅広いスキルや専門性が求められる
- 全組織のデータを一つの組織で管理することは現実的ではない
- データマネジメントには、技術的、非技術的なスキルと協調性が必要
- データマネジメントには全社的な視点が欠かせない
- 局所的に導入はできるが、効率的に行うには企業全体に導入する必要がある
- データマネジメントには幅広い視点を考慮する
- データ利用方法や、利用者変化の方法に対応するため、データマネジメントは常に変化しなければならない。
- データマネジメントはライフサイクル管理
- データには、ライフサイクルがあり、データマネジメントは、データライフサイクルを通じた管理である。
- データがデータを生み出すこともあり、管理は複雑である。
- データマネジメントを実践するにはライフサイクルを考慮する。
- データは種類によりライフサイクルが異なる。
- データマネジメントにあたり、データの種類によってデータ管理に求められることも変わるため、ライフサイクル要求に対して柔軟に答えられるようにする
- データに伴うリスク管理もデータマネジメントに含まれる
- データは資産でもあるが、リスクでもある。
- 消失したり、盗まれたり、誤用されることがある。組織はデータを利用するにあたり倫理的な意味も考慮する必要がある。
- データマネジメント上の要件が、IT上の決定を左右する。
- 組織の戦略的なデータ要求はITにより決まるのではない。ITの力を借りて実現される。データマネジメントには、そのようなアプローチが必要になる。
- 効果的なデータマネジメントには、リーダーのコミットが必要
- データマネジメントには、複合的なプロセスが絡んでおり、コーディネートし、協調し、確実に責務を果たさない限り効果を生まない。
- その実現には、管理スキルだけではなく、ビジョンや目的が必要で、リーダーがコミットすることが必要。
データマネジメントの課題
データには特性があり、データマネジメントには明確な特徴があり、データマネジメントの原理原則に従うとき発生する課題があります。
本章では、データマネジメントを行う際に発生する課題を下記に記載します。
データは他の資産と異なる特徴を持つ
他の資産と比較して、下記の特徴があります。
金融資産や物理的な資産
- 同時に一箇所にしか存在しない
- 識別、移動、触ったりできる
- 貸借対照表上に存在する
データ
- 有形ではない
- 耐久性をもたせることが可能
- 古くなると価値が変化するが、無くならない。
- コピー、転送が可能
- 失われたり、破壊されると修復は困難。
- 使用しても減らない。
- 変化すると様々な目的に使用できる
これらの違いから、下記の課題が考えられます。
- データの所有者、組織はどれだけのデータを保有しているか
- 間違って使われないか
- 重複して持つことによるリスクはないか
- 品質基準を決めてそれを守らせるにはどう管理すべきか
データは重要な役割を果たすため、注意深く管理すべきです。
データ評価
データを評価する際に、価値に着目します。
価値とは、発生するコストと、そこから生まれる恩恵(ベネフィット)との差になります。
データは組織独自のものであるため、データを評価するアプローチを始めるにあたり、まずは組織で一貫して適用できる汎用的なコストと恩恵(ベネフィット)の分類を行います。
ベネフィット
- より高品質なデータから受ける恩恵
- 競合他社がデータに支払う価値
- データの売却により得られる価値
- 斬新な方法でデータを利用した場合に期待できる収益
コスト
- データの取得保存にかかるコスト
- 喪失したデータを復元するコスト
- データが欠落している場合の組織への影響
- データに関連するリスク軽減とリスクを抱えることの潜在的なコスト
- データの改善にかかるコスト
組織の状況によってデータの価値が異なることや、時間によってデータの価値が異なることがデータ資産を評価する際の主要な課題です。
組織が一貫した経営判断するためには、資産を財務的に捉える必要があります。
データ品質
データマネジメントの根幹は、データが高品質であることを保証することです。組織がデータを管理するのは、それを利用するためです。
業務ニーズを満たすためにデータを利用できないならば、収集したり保護したりするのは努力の無駄です。
データが業務上のニーズを確実に満たすために、高品質のデータが何によって生成されるのかを含めて、データの利用者と協力してニーズを定義する事が重要です。
利用者は、データの信頼性・信憑性は高いと信じているが、その信頼が一度失われるとそれを取り戻すにことは困難です。
データを利用することでインサイトを得て、それを活用して価値を生み出すが、データの品質が低い場合、意思決定に悪影響を及ぼします。
低品質なデータの問題に対処する際のコストは、収益の10%〜30%を費やしているようです。
高品質なデータを生み出すための留意点
- データの品質管理は、一度対応すれば良いわけではなく、高品質なデータを生み出すためには、業務プロセスやシステムに品質を組み込む考え方を組み込まなければならなく、継続的に取り組み必要があります。
- データ品質は、全てのデータマネジメント機能から影響を受けるため、どんな業務を行うときでもデータ品質を考慮する必要があります。
より高品質なデータを目指した計画
より高品質なデータを目指す計画において、アーキテクチャ、モデリング、その他設計機能に対して、戦略的なアプローチが必要です。また、業務とITのリーダーが戦略的に連携することも必要です。
これらの計画を綿密に立てる必要があります。
メタデータとデータマネジメント
企業がデータを資産として管理するためには、信頼性が高いメタデータが必要です。メタデータは下記の内容が記述されます。
- 組織内にどんなデータが存在するか
- 何を表しているか
- どのように分類されるか
- どこから来ているのか
- 組織内をどのように移動しているか
- 誰が使えて、誰が使えないか
- どの程度の品質か
データをうまく管理していない組織は、たいていメタデータも管理していません。そのためメタデータ管理がデータマネジメント全体を改善する出発点になります。
データマネジメントは機能横断的である
データマネジメントは複雑なプロセスであり、様々なスキルや視野を持つ人々に、様々な要素がどう絡み合っているかを認識してもらった上で、共通の目標に向かってうまく協力してもらう必要があります。
全社的な視点を確立する
データは、組織にまたがります。データはある組織にとって固有であるだけではなく、部門や下部組織だけに固有な場合もあります。
データは業務プロセスの副産物として見られることが多く、当面必要とされるニーズを超えてデータの利用計画が立案されることは少ないです。
その反面、データを利用するステークホルダーとしては、データは組織内で一貫していること、様々な人々がデータを利用できるように分りやすくまとまっていることが求められる。
データガバナンスが重要な理由の一つとして、業務をまたがり流れるデータについて組織が判断できるように手助けすることになるためです。
他の視点を考慮する
データを生成する人は、後で他の人がそのデータを使用していることを忘れがちです。
データが潜在的にどう使われているかが分かれば、データライフサイクルの立案が可能になり、それによりデータ品質も向上します。
また、データは誤用されるため、そのリスクを考慮することで誤用の危険性を低減できます。
データライフサイクル
データ資産を効果的に管理するには、データライフサイクルを理解し計画を立てる必要があります。
戦略的な組織は、データの値に求められる要件だけではなく、それを管理するときの要件も明確にします。要件には下記のようなものが含まれます。
- データ利用
- 品質
- 統制
- セキュリティに関する方針
- 期待度
データライフサイクルのプロセスに着目して、データマネジメントを行うことで適切に管理ができます。
- データ生成とデータ利用は、データライフサイクルの中で最も重要な局面である
- データ生成にはコストがかかり、使用され活用されたときに価値を生みます。
- データ品質をデータライフサイクル全体で管理する
- データ品質管理は、データマネジメントの中核です。
- 品質の低いデータは価値よりもコストとリスクを産みます。
- データは、プロセスの副産物として生み出される事が多く、データの品質に関する明確な基準を組織が設定しないため、データ品質の管理が困難になります。
- メタデータの品質をデータライフサイクル全体で管理する
- 通常のデータ品質と同様に管理が必要です。
- データセキュリティをデータライフサイクル全体で管理する
- 保護が必要なデータを生成から廃棄までのライフサイクル全体を通じて守らなければなりません。
- データマネジメントに当たっては最も重要なデータに焦点を当てて取り組む
- 組織は多くのデータを生成するものの、殆どの部分は実際には使用されません。すべてのデータを管理することはできないため、ライフサイクル管理において組織の最も重要なデータに焦点を当てて、データのROT※を最小限にします。
※Redundant:冗長、Obsolete:陳腐、Trivial:些末な
多様な種類のデータ
データは、種類や、ドメイン、フォーマット、保護レベル等によって分類できます。これらの分類によって、要件が変わり、関わるリスクも異なり、組織内での役割も変わり管理要件が変わります。
データとリスク
データは価値だけではなくリスクも生みます。すべての業界で組織が持つ資産として情報の役割が強化され、情報の潜在的な使用及び乱用に関して、規制当局や政治家の注目を集めています。
下記のような法案や規制が急拡大しています。
- データプライバシー規制
- サーベンス・オクスリー法
- ソルベンシーⅡ
これらの遵守や、リスクが適切に管理されていない場合は、ステークホルダーの信頼失墜や罰則に繋がります。
データマネジメントとIT
データマネジメントの活動範囲は広く、ITスキルと業務スキルの両方を必要とします。現在、データはほとんどコンピューターで保存されるため、データマネジメント業務はITの影響を受けます。
ただし、勘違いしてはいけないのは、ITを先に決めるのではなく、事業戦略に従ってデータ要件を決めて、そこからITを決定します。
効果的なデータマネジメントには、リーダーシップとコミットメントが必要
世の中一般的には、ITとデータを混同し両者を適切に管理できずデータについて戦略的な取り組みをすることもありません。またデータマネジメントに関わる仕事を過小評価しています。
データを管理するには特有の課題があり、データマネジメントが成功するには、IT主導ではなく業務主導でなければなりません。そのためCDOの役割が必要になります。
CDOは、データマネジメントへの取り組みをリードし、組織がデータ資産を活用し、競争力を生み出すことを可能にします。また組織が戦略的に取り組めるように企業文化を変革していくことが求められています。
データマネジメントフレームワーク(DAMAフレームワーク)とは
データマネジメントに関する知識を体系立ててまとめたものです。DMBOK はData Management Body of Knowledgeの略称です。現在までに、第2版が出版されており、DMBOK2などと呼ばれます。
データマネジメントに取り組むにあたり、最低限のレベルをもれなく対応するにあたり指針となります。
DMBOK2の知識体系は、下図のようにフライホイールで整理されておりデータガバナンスが中心に配置されていることがわかります。また、フライホイールを支える形(フライホイールの外)でその他の知識領域が定義されています。
章 | 知識エリア | フライホイール | 解説 |
1 | データマネジメント | ◯ | フライホイールそのもの |
2 | データ取扱倫理 | ||
3 | データガバナンス | ◯ | フライホイールの中心 |
4 | データアーキテクチャ | ◯ | |
5 | データモデリングとデザイン | ◯ | |
6 | データストレージとオペレーション | ◯ | |
7 | データセキュリティ | ◯ | |
8 | データ統合と相互運用性 | ◯ | |
9 | ドキュメントとコンテンツ管理 | ◯ | |
10 | 参照データとマスターデータ | ◯ | |
11 | データウェアハウス | ◯ | |
12 | メタデータ | ◯ | |
13 | データ品質 | ◯ | |
14 | ビッグデータとデータサイエンス | ||
15 | データマネジメント成熟度アセスメント | ||
16 | データマネジメント組織と役割期待 | ||
17 | データマネジメントと組織の変革 |
独自のデータマネジメント知識エリア(DMBOKを再整理したもの)
DMBOK2は、データマネジメントの知識体系として、全600ページ程度からなる重厚な書籍となっています。これを全て読解することは難しく、また、あくまで知識体系であるため、具体的な内容は個社に適合させていく必要があります。
そのため、本ブログでは、DMBOK2を元に類型化・統合・追加し整理し下記のように定義します。
分類 | 独自の知識エリア | 元のDMBOK 知識エリア |
データ企画・戦略 | データ企画・戦略 | 1.データマネジメント |
オペレーション | データガバナンス | 2.データ取扱倫理 |
3.データガバナンス | ||
9.ドキュメントとコンテンツ管理 | ||
15.データマネジメント成熟度アセスメント | ||
データ品質管理 | 13.データ品質 | |
メタデータ管理 | 12.メタデータ管理 | |
データモデリング・統合・MDM | 5.データモデリングとデザイン | |
8.データ統合と相互運用性 | ||
10.参照データとマスターデータ | ||
データアーキテクチャ | 4.データアーキテクチャ | |
6.データストレージとオペレーション | ||
11.データウェアハウス | ||
14.ビッグデータとデータサイエンス | ||
データセキュリティ | 10.データセキュリティ | |
組織 | 組織と役割期待 | 16.データマネジメント組織と役割期待 |
組織変革管理 | 17.データマネジメントと組織の変革 |
今後、上記の独自の知識エリアについて、掘り下げて記事を書いていく予定です。
参考書籍
本記事は、私の経験に基づいて記載していますが、基礎的な知識についてはデータマネジメント知識体系ガイド 第二版(DMBOK2)を参考にしています。最初は章ごとに読み込んだり、後ほど必要になった際に参考にすると良いと思います。
最後に
今回の記事では、「データマネジメントの基本」として、データマネジメントとは何か?なぜマネジメントする必要があるか?など解説しました。
今後は、本ページで定義した独自のデータ知識エリアに基づいて詳細を深掘りしていく予定です。
これからデータマネジメントに関する業務を始める方の参考になれば幸いです。
今回も読んで頂きましてありがとうございました。
コメント