データ分析とインテリジェンス

今あるデータを前提にしてはいけない理由

■「今あるデータで何かできないか」は選択肢を狭めるだけ

「今あるデータで何かできないか」と考える人がとても多い。そこにあるから使わなければもったいないとか、あわよくば利益が出たらうれしいとか、そうしたい気持ちはわかるのだが、そこはぐっと堪えて「何が目的であり、そのためには何を知るべきか」から始めるべきだ。さもないと、まったく見当違いの分析をしたり、分析はしても実行に繋がらないことになり、結局無駄になる可能性が高い。

■問題解決のあるべき順番

まず最初に、データ分析プロセスの全体像を考える。これはデータ分析プロセスの全体像「インテリジェンスサイクル」とはに掲載した図を再掲すると

intelligencecycle
図:インテリジェンスサイクル

このように、まず目的があり、その目的を解決するために「何を知りたいか」という要求が行われた後、初めてデータの収集が開始される、というのが本来の流れである。「今あるデータで何かできないか」から始めるということは、このプロセスの途中から始めるということになる。

■データを前提にするとどうなるか

今あるデータを前提にするということは、インテリジェンスサイクルでいうといきなり「分析」から入ることになる。抜け落ちるのは「何が目的であり、そのためには何を知るべきか」のフェーズだ。今あるデータで知るべきことがわかるかの保証もないのにそのデータを使おうとするのは、いわば本来ならば穴を開けたい(何が目的か)→ドリルが必要である(そのためには何を知るべきか)→ホームセンターに買いに行く(収集)という流れであるべきところを、ハンマーを持って「さて、これで何をしよう」と考え始めるのと同じことである。

■ツールや理論も同じ。それを前提にしてはいけない

「せっかくツールを導入したのだから使いたい」とか「新しい理論を勉強したので使ってみたい」も同様で、「何が目的であり、そのためには何を知るべきか」から始めなければその分析は失敗するかほとんどが無駄になるだけだ。が、世の中の分析の大半はこのうちのどれかだ。たまたま目的に合致してうまく行くこともあるが、それは偶然に過ぎない。

■とはいえデータから始めなければいけないことの方が多い

とはいえ現実問題としては、上司やクライアントから今あるデータだけで何かやれと言われ、足りないといってもコストがかかると却下され、それでやるしかないというのがほとんどなので、そんな場合に備えて準備もしておかなければいけないのが悲しいところではあるのだが・・・。

このエントリーをはてなブックマークに追加

タグ:分析 データ分析プロセス


最新のブログ記事5件

定期レポートを効率化する
最悪のデータ分析組織とは
「何を知りたいのか」がわからなければデータ分析は始まらない
データ分析で業務委託を使う・外注する方法
データ分析について考えたことのまとめ

ブログトップ > 今あるデータを前提にしてはいけない理由