データ分析とインテリジェンス

移転しました。今後こちらのサイトは更新しません。移転先→新ブログ

書評・感想『データ解析の実務プロセス入門』

■総論

データ解析(分析)プロセスを題名にした書籍が6月に2冊発売されるが、こちらは発売が早い方。早速入手して一通り目を通したので、書評というか感想を書いてみる。

この本はデータ解析のプロセスと題名にもあるように、データ分析のプロセスの全体像と、それにまつわるテーマ(特にデータ収集・前処理・基礎集計)について書かれためずらしい本。統計学や機械学習の専門書とは一線を画し、分析の手法についてはほとんど触れていないので、データ解析という言葉だけで手に取ると普段見かけるのと大分様子が違うことに戸惑うかもしれない。

前書きによるとデータ解析の入門者・未経験者を想定しているとのことだが、プロセスとしてとらえるにはある程度データ分析の実務経験があり、さらに様々な人とのコミュニケーションを経て問題意識を持ってからの方が身に付くと思われる。もちろん最初からその視点持って活動できればそれに越したことは無いので読んで損になることは無いだろうが、効率という意味では実務経験者の方が遥かに良いだろう。

経営者やマネージャーにとっては現場向けの記述が多いのであまり読む意味はないかもしれない。読むとしても第1章・第2章で十分だろう。第5章にある運用ではKPIについて書かれているが、そんなに詳細ではない。

こうして欲しかったという点は2つあって、1つはデータの基本的な集計方法はあったがそこからデータから本質を捉えるにはどうした良いのかという議論があまり無かったこと(簡単ではないのは十分承知の上だが)、もう1つは話を聞かない経営者、データを理解していない営業、丸投げしたら何か良いものが出てくるとなぜか思い込んでいるクライアントとの戦い、もといコミュニケーションについてもっと書いてあっても良かったのではないかということ。第6章・第7章の変わりにこのあたりを入れてもよかったのではないかと。

■第2章:データ解析のプロセス

データ分析を10段階のプロセスとして説明している。

  • 1・目的設定
  • 2・分析計画
  • 3・データ設計
  • 4・データ収集・保存
  • 5・データの前処理
  • 6・分析手法選択と適用
  • 7・分析結果の解釈
  • 8・施策の提案
  • 9・実施と検証
  • 10・反省、さらなる改善のために

実は詳細には違いがあるものの、データ分析の全体像「インテリジェンスサイクル」とはでも紹介しているインテリジェンス・サイクルと基本的には同じであり、おそらく著者の方はインテリジェンスに関する知識をお持ちではなかろうかと予想される。

■第3章:収集と前処理について

第3章とまとまってはいるが、中身は

  • ・前半:データについて
  • ・中盤:アンケートについて
  • ・後半:前処理について

と3つのテーマが展開される。中盤のアンケートについては必要に応じて読めば良いが、それ以外は実務を行っている人ならヒントになることも多いだろう。

元になる考え方が同じであれば、詳細はともかく大筋には同じになる。これもデータ分析の実務についてなどで紹介しているのと近い内容。

■第4章:探索的データ解析

グラフや相関分析など、基本的な集計についての方法が書かれているのだが、ではそこからどうやってデータを読むか?についてはあまり触れられていない。もっとも、本質を読むと言うのは簡単だが、そのためには前提として知識と経験が必要であり、何を分析すれば良いかわからないという状態で始める探索的データ解析をする状況においては、本質をつかむなどというのは難しいだろう。とはいえ基礎的なグラフをいくら並べたところで何か解るわけでもなく、基礎集計の方法論を参考にするぐらいか。

■分析以外のフェーズに特化した形での続編を希望

データ分析をプロセスとしてとらえる必要があることについては全く同意で、CRISP-DMなど多少はモデルがあるもののほとんど無視されてきた中で、今回書籍として発売され多くの人の目に触れる機会が増えるのはデータ分析業界にとっても良いことなので、是非分析手法やテクノロジー以外の様々なテーマに特化した形での続編を期待したい。

このエントリーをはてなブックマークに追加

タグ:書評・感想


最新のブログ記事5件

大学や独学でデータ分析の勉強をしただけだと実務で使えない理由
「データ分析をする人」とは何をする人のことを指しているのか
定期レポートを効率化する
最悪のデータ分析組織とは
「何を知りたいのか」がわからなければデータ分析は始まらない

ブログトップ > 書評・感想『データ解析の実務プロセス入門』