データ分析とインテリジェンス

3年前なら使い道はあったかもしれないが・・・書評・感想『データサイエンティスト・ハンドブック』

■総論:3年前なら使い道はあったかもしれないが

3年ぐらい前にデータサイエンティストという言葉が出始めた頃であれば、全体像を見るのに役に立ったかもしれない。しかし、すでに下火になった現在になって、多くは過去に発表されている記事のまとめで目新しい議論もあまりなく、正直なところ「今更?」というのが感想である。内容も雑多で、経営者から現場に至る関係者全員に向けて書いたからだろうか、ページ数が少ないのに詰め込み過ぎて誰向けなのかわからなくなってしまっている。

特に気になるのは第2部で、約50ページと3分の1(全部で150ページぐらい)も使いながらもどうにも使いようが無い(詳細は後述)。無理に書いても専門書にはかなわないのだからいっそこの章をはずし、第1部も半分にした上で第3部の議論に厚みを持たせれば、今までのデータサイエンティスト本とは一線を画した書籍になったと思われる。

その上で誰が読むべきかといえば、経営者・マネージャーには第3部が参考になるかもしれないが、これからデータサイエンティストを目指す人、今データサイエンティストでこれからを考えている人にはあまり使い道はない。

価格は経営者やマネージャーが第3部を読むためなら2,700円でも高くはないだろうが、一方でデータサイエンティストにはこの価格は高すぎるので会社で1冊買って回し読みで十分。自分で買うならその分3分の1の価格の『大本営参謀の情報参謀』か、少し足して専門書を買うべき。ハンドブックという位置づけならばより広く読んでもらうためにも全体で約150ページと分量も少ないことだし、新書や文庫でもよかったのではと思う。

■目次

内容は大きく分けて3部に分かれている。第1部はデータサイエンティストの概要、第2部は分析手法の紹介、第3部は組織やプロセスなどその他のトピック。目次は以下の通り。

第1部 データサイエンティスト

  • ・第1章 データサイエンティストとは
  • ・第2章 データサイエンティストになるには
  • ・第3章 データサイエンティストの育成

第2部 データ分析の手法

  • ・第4章 データ分析の局面
  • ・第5章 データの準備と可視化
  • ・第6章 アソシエーション分析
  • ・第7章 クラスタリング
  • ・第8章 分類・回帰
  • ・第9章 統計的機械学習
  • ・第10章 時系列解析
  • ・第11章 最適化
  • ・第12章 実験計画

第3部 データ分析を有効活用できる組織

  • ・第13章 データを活用する組織の形態
  • ・第14章 データサイエンティストの調達
  • ・第15章 データ活用プロセスの構築
  • ・第16章 分析基盤の整備とデータの管理
  • ・第17章 データの分析・利用に関する権利と義務
  • ・第18章 実験計画

各部ごとに感想を。

■第1部 データサイエンティストについて。定義は相変わらずよくわからない

第1章でデータ分析の仕事の流れとCRISP-DMの紹介の後、第2章ではデータサイエンティストについてスキル(2.1)、学習の方法(2.2)、キャリア(2.4)などが続くが、各内容共に1-2ページで紹介に留まっており、多少参考にする程度。特にキャリアについては日本でのデータ分析の実態が見えないため、スキルさえあれば何とかなるという誤解をさせかねない。実態についてはデータサイエンティストブームを総括するデータ分析の専門家になりたければ中小企業に行く理由はあまりない現在の日本においてデータアナリストであることはハイリスク・ローリターンあたりを参考にしつつ読んだ方がよいだろう。

■第2部はいらない

第4章から第12章にかけて、様々な手法を数ページづつ使って説明しているのだが、データサイエンティストを目指す人がこれで学ぶのは無理だ。より高度な分析手法の解説のために、既知の知識の確認として冒頭に書かれるよりもさらに簡略化されている。

内容も、約50ページで出てくるキーワードをざっと書くと・・・・・目的変数と説明変数、可視化、アソシエーション分析、階層的クラスタリング、k平均法、分類、回帰、モデル選択、フィッティング、特徴量の抽出、高次元データの呪い、確率過程、定常、非定常、状態空間モデル、線形計画法、凸計画法、勾配法、相関と因果、A/Bテスティング、直交表・・・といった状態で、紹介程度にしかならないのはわかるだろう。

分析を知らない人がこれを読んで手法を理解した気になり、まったく関係ない問題なのに「○○分析というのがあるそうだが使えないのかね?」などと知ったかぶりなどしたら裏でバカにされるのがオチだ。経営者・マネージャー向けに手法の説明はもっと簡略化し、「こういう問題にはこういう手法があって、このような実例がある」という書き方であれば使えたのではないだろうか。

■第3部 

第3部ではその他様々なトピックを扱っている。その中でも「第13章 データを活用する組織の形態」「第15章 データ活用プロセスの構築」についてはちょうどこの問題を抱えていて解決方法を探している人なら役立つかもしれない。あとの章はダイジェストなので、それぞれもっと詳しい書籍を探した方がよいだろう。

第13章 データを活用する組織の形態

組織形態について。1・専門組織型、埋め込み型の比較、2・ハイブリットの説明、3・どう適用するか、という流れで展開される。あまり議論されない話題なのでこの問題を抱えている経営者・マネージャーには参考になる。

ただしデータサイエンティスト・ハンドブック独自かというとそうではなく、2011年に発売されている、トーマス・H・ダベンポート、ジェーン・G・ハリス、ロバート・モリソン 村井章子訳『分析力を駆使する企業 発展の五段階』の中ですでに同じ議論が展開されており、ハイブリット型は『分析力を駆使する企業』でいうセンター・オブ・エクセレンス・モデルと同じである(『データサイエンティスト・ハンドブック』の著者と、『分析力を駆使する企業 発展の五段階』の著者にそれぞれアクセンチュア社の人がいるので、もしかしたらアクセチュア社のナレッジなのかもしれない)。

第15章 データ活用プロセスの構築

本書における最も利用価値のありそうな章。データ分析を業務プロセスに組み込む方法を「構想」「検証」「パイロット展開」「本格展開準備・運用」の4ステップにしたモデルを紹介している。プロジェクトを動かす場合に参考にすると良いだろう。

ただし、「データ分析プロジェクトを動かす場合」に参考にはできるのだが、「データ分析を重要視しない経営者をどう動かすか」とか「データ分析の結果を利用しなかったり無視したりする人をどうするか」という(より重大な?)問題については触れられていない。現実には後者で引っかかる人がほとんどなので、この章を参考にするところまでたどり着けたらそれだけで大分幸せな環境なのが悲しい。

■まとめ:第3部にみる将来性

組織、人材育成、プロセスマネジメント、意思決定、法律など経営者・マネージャー向けの話題が展開されている書籍は少ない。それは単純に需要が少ないからであるが、かといってまったく需要が無いというわけでもあるまい。データサイエンティスト・ハンドブックはこの方向に特化した方が良かったのではないだろうか。中途半端になってしまったのは非常に残念なところだ。

とはいえ今後のデータサイエンティスト・データ分析関連本は、専門家向けの高度な専門書、経営者・マネージャー向けの本、一般向けの個人的体験談と入門書の3つに分類されていくだろうが、そんな中で経営者・マネージャー向けのデータ分析本としての先駆者になったことは確かだろう。この後に続く書籍には、実態に沿った上でより深い議論を期待したい。

このエントリーをはてなブックマークに追加

タグ:書評・感想 データサイエンティスト・ハンドブック


最新のブログ記事5件

大学や独学でデータ分析の勉強をしただけだと実務で使えない理由
「データ分析をする人」とは何をする人のことを指しているのか
定期レポートを効率化する
最悪のデータ分析組織とは
「何を知りたいのか」がわからなければデータ分析は始まらない

ブログトップ > 3年前なら使い道はあったかもしれないが・・・書評・感想『データサイエンティスト・ハンドブック』