データ分析とインテリジェンス

移転しました。今後こちらのサイトは更新しません。移転先→新ブログ

分析の結果がおかしいと思った時のチェックリスト

データを準備して、ツールに投入して実行したら、予想していたのとは大分違う結果が出てきて戸惑う、なんてことは日常茶飯事だが、その際どうやって検証したらよいかについてまとめる。

正しいデータを使っているつもりだったのに調べてみたら間違っていたというのが最も多いだろう。その内容も様々である。

>>>続きを読む

「バズワードの栄枯盛衰モデル」を具体化してみる

バズワードの栄枯盛衰モデルというのを考えたが、モデルだけではよくわからないので、具体的にいくつかのキーワードについてこのモデルを当てはめてみる。なお、学術的調査を行っているわけではないので目下のところは独断と偏見に基づく。

(他も同じようなものだが)最近よく聞こえるけれどもなんだかよくわからないワードで次に来そうなのがマーケティングオートメーション。書籍も発売され露出も増えているようだがどうもいまいち盛り上がっていない感があるのは具体的にどう使うのかイメージができないからか。あれもこれもできると漠然としすぎても伝わらないので、もっと具体的な問題に対してどのような解決をすることができるか、を提案した方がわかりやすいのでは、というのがはたから見ての感想。

>>>続きを読む

データサイエンティストを雇う前にスキルについて考えるべきこと

データサイエンティストなどデータ分析者の募集を見ると、求められるスキルに「統計学」「機械学習」「データマイニング」などかなり漠然と分析手法についての記載しかないことも多い。では実際に話を聞けばわかるかというと、過去様々な企業の面接に行ったが分析が大事だとか力を入れるとは言いつつも、現在の状況・今後の展望・求めるスキルについて明確にしてくれ企業は記憶にない。要するに、企業側もよくわかっていないのである。

というわけで、先日データサイエンティストを雇う前に考えるべきことに「求めるスキルは何をどれぐらいか」という項目を追加したが、この部分についてもっと掘り下げて考えてみる。ちなみに前回追加したのは以下の通り。各項目についての詳細と、さらに追加で考えたことが続く。

>>>続きを読む

「データをいじくり回して何かわかった気になる症候群」から逃れる方法

目的なしにデータ分析をすることがどれだけ無駄であるかについてで「数字をいじくり回すのは楽しいので、気が付くとあっという間に時間が過ぎる。何かがわかった気にはなれるが、後には何も残らない。よほど意識していないとすぐこの状態に陥ることになるが、ためしにここ数日の間でデータを見ていた時間のことを思い出してみればいい。なんとなく数字を見て、今何か変わったことがあるだろうか?」と書いたが、これを「データをいじくり回して何かわかった気になる症候群」とでも呼ぼう。この状態に陥らないためにはどうするべきかを考える。

結局のところは目的を意識しているかいないかでこの問題はかなり解決する。目的を意識しないでデータを見ているというのは目的地を決めないで歩いているようなもので、歩いてはいるがその方向が正しいのかわかりようがないし、いつまで経っても無いところにはたどり着けない。散歩であれば散歩そのものが目的かもしれないが、ビジネスにおいて単にデータを見ることが目的ということなどありえない。なので「何を知るためにこのデータを見ているのだっけ?」を常に意識する。

>>>続きを読む

データサイエンティストが就職・転職で地雷を踏まないために注意すること

転職してみたら自分の持っているスキルと求められているスキルが違う、関係ないことばかりやらされる、求められる仕事のレベルが低すぎるなど、入社してから「こんなはずじゃなかった・・・」という話は後を絶ちません。もちろん、データ分析も例外ではありません。

というわけで、データ分析者が就職・転職するにあたり事前に対処する方法について考えます。なお、データサイエンティストに限らずデータアナリスト、Webアナリスト、リサーチャーなど分析関連の仕事であれば同じようにあてはまりますので自分に合わせて適度に置き換えてください。

>>>続きを読む

目的無きデータ分析は無駄である

何かいいことが見つかるかもしれないからと何の目的も無しにデータを見るのは時間の無駄である。データを見て何ができるかを考えるべきではない。最終的に様々な事情で今あるデータのみを使って考えざるを得なくなる場合は多々あるとしても、最初から可能性を限る必要はない。

データ分析は意思決定のために行われる。その意思決定は何等かの目的があるからこそである。目的が無ければどんなに数字をいじくりまわしたところで「それで?」で終わるだけになる。それは時間の無駄としか表現のしようがない。

>>>続きを読む

データサイエンティストの理想と現実

特にデータサイエンティストが顕著だが、どうも巷で喧伝されている姿と実態に大分乖離があるように思えるので、データアナリストなどデータ分析者の理想と現実について一覧にまとめた。

あえて両極端な場合を書いているが、もちろん現実にはどちらか一方ばかりというわけではない。人によって大分違うだろうが、全体的に見れば理想:現実=1:9か2:8あたりではないだろうか。

>>>続きを読む

競合分析・競合調査とは・・・『競争優位の情報戦略』で競合分析を学ぶ(1)

戦略情報に関する書籍は非常に少ない上にほぼ翻訳本であるということは、やはり日本で戦略情報の需要がいかに少ないかということであろう。そんな中、これも翻訳本であるが良書である『競争優位の情報戦略 公開情報でここまで読めるライバルの経営戦略』を紹介する。

最初に言葉について説明しておく。本来であれば、「競合分析・競合調査」と「コンペティティブ・インテリジェンス」は明確に区別されるべき言葉であるが、あえてこのサイトはでは本文の引用以外では基本的に「競合調査・競合分析」=「コンペティティブ・インテリジェンス」を使用する。

>>>続きを読む

3年前なら使い道はあったかもしれないが・・・書評・感想『データサイエンティスト・ハンドブック』

3年ぐらい前にデータサイエンティストという言葉が出始めた頃であれば、全体像を見るのに役に立ったかもしれない。しかし、すでに下火になった現在になって、多くは過去に発表されている記事のまとめで目新しい議論もあまりなく、正直なところ「今更?」というのが感想である。内容も雑多で、経営者から現場に至る関係者全員に向けて書いたからだろうか、ページ数が少ないのに詰め込み過ぎて誰向けなのかわからなくなってしまっている。

特に気になるのは第2部で、約50ページと3分の1(全部で150ページぐらい)も使いながらもどうにも使いようが無い(詳細は後述)。無理に書いても専門書にはかなわないのだからいっそこの章をはずし、第1部も半分にした上で第3部の議論に厚みを持たせれば、今までのデータサイエンティスト本とは一線を画した書籍になったと思われる。

>>>続きを読む

データ分析のためのExcel

>>>続きを読む