データ分析とインテリジェンス

データ分析がプロセスであることを意識しないと見えないこと

■議論されてこなかった重要な問題

データ分析をしたいと統計学や機械学習の勉強をしている人は多いが、実務で使ってみようとするとなかなかうまくいかない。その大きな要因の1つは統計学や機械学習の手法を使うというのはデータ分析プロセスの一部であってそれだけでは成立しないからであるが、それが指摘されることは非常に少ない。

これはいままでビジネスの中でデータ分析が使われることが少なかったゆえに問題点が表に出てこずあまり議論されてこなかったことが原因だと考えられる。ということは見方を変えれば今のうちからこの問題について考えておけば差別化ができるということでもある。

例えばスポーツで考えてみるとよいだろう。データ分析における統計学や機械学習などの分析手法は、野球で言えばダイビングキャッチ、サッカーで言えばPK、テニスで言えばスマッシュみたいたもので、ある程度でも経験があればそれだけを練習している選手が強くなれると考える人はいないだろう。そう考えるのは全くの素人ぐらいだ。それらのスキルを生かすためにはまず基礎練習(Excelやパワポ)や基礎体力(コミュニケーション)が必須であるということにも納得してもらえるだろう。スポーツ以外でもそうだが、表に見える目立つ部分だけを見てそれで全てであると受け止めるのは危険だ。データ分析も同様で、分析手法を使うことはプロセスであるという理解が重要なのである。

では、データ分析がプロセスであることを意識しないことでどのような弊害がおきているのか。

■データ分析がプロセスであることを意識しないと見えないこと

もしデータ分析がプロセスであることを意識せずに、与えられたデータを元にに手法を使ってアウトプットを出すことだけだと考えていると、以下のような本来やるべきことが欠落する。

  • ・何が問題であるかを決める
  • ・問題解決のために何を知る必要があるかを考える
  • ・たくさんの課題と様々な制約条件の中で取り組む内容と優先順位を決める
  • ・情報収集、保管、管理について考える
  • ・データハンドリング、前処理を行う
  • ・分析結果を洞察して次にどうするべきかを考える
  • ・資料作成とプレゼンテーションを行う
  • ・施策の実行とフィードバックを行う

これらは1つ1つが大きな問題であり、1つでもないがしろにすれば無駄な時間を取られたり分析が無駄になったりしてしまう問題なのだが、残念ながら多くのデータ分析では意識されることすら少ない。

■データ分析プロセスにおける最重要項目:何が問題であるかを決める

一言で言えば目的無きデータ分析は無駄であるということだ。まず最初に分析の目的を決めなけれならない。目的を決めずにいきなりデータを触りだしたりすると、適当にいじくりまわしているうちに面白そうなデータが出てきたりして、いつの間にかに時間が過ぎて仕事をした気にはなれるが、実態はただ時間が過ぎただけ、などということがよく起きる。 目的をはっきり言われなかったから「相手はこう考えているだろう」などと勝手に想像して分析を進めた結果が「こんなのいらない」「今そんな分析は必要ない」などということにもなる。

「探索的データ解析」という言葉もあり、方針が決まっていない時に「とりあえず基礎的なデータを見てみる」ことがよく行われるが、データを見て何か思いつくのはなんらかの問題意識があるからであり、とにかく何か思いつくかもしれないとデータを見るのは多大な浪費となる。

目的が決まったとしても、その目的設定が正しいのかどうかはまた別問題。もっと優先順位を高めるべき問題が抜けていないか、そもそもその問題設定は正しいのか、と刻々と変わっていく状況の中で常に見直していかなければならない。もちろん、間違えた目的設定がされていれば、分析はあらぬ方向へ向かっていく。

さらには、もし意志決定者に明確な目的があったとしても、それが正しく分析者に伝わるか、あるいは分析者がその目的をきちんと聞きだせるのかということも問題になる。これは結局のところクライアントや上司との信頼関係が構築できるかであり、分析とは全く別のスキル、いや、スキル以前に人間性の話になるが、今までのデータ分析の話題ではあまりにもないがしろにされている部分だろう。

■データ分析はプロセス全体が動いて初めて価値が出る

データ分析は、目的の決定から始まって施策が実行され、その結果が出て初めて価値となる。学問としての研究は別として、少なくともビジネスでは社会(あるいは自社の利益)に対してどれだけ有益であるかで図られるべきで、分析はしたから理解されなくても使われなくても利益に繋がらなくても自分の責任ではない、と考える人が多く見受けらるがその認識は間違いだ。

プロセスに参加している以上、そのプロセスがうまく動かなければそこに参加している全員の失敗である。データ分析の失敗の責任は経営者・マネージャーにあるのは当然として、分析者もまずはできることはやりきった後でそれでもなおプロセスがうまく動かないのであれば、然るべき指摘をしなければならず、それでもプロセスをうまく動かすことができなければそれはまた分析者の失敗でもあるのだ。

このエントリーをはてなブックマークに追加

タグ:データ分析 データ分析プロセス


最新のブログ記事5件

定期レポートを効率化する
最悪のデータ分析組織とは
「何を知りたいのか」がわからなければデータ分析は始まらない
データ分析で業務委託を使う・外注する方法
データ分析について考えたことのまとめ

ブログトップ > データ分析がプロセスであることを意識しないと見えないこと