データ分析とインテリジェンス

[SQL]条件(店舗名・顧客名など)を複数指定して抽出する

salesテーブルからstore_nameが「新宿」「渋谷」である行を抽出する。

SELECT * FROM sales where store_name in ('新宿','渋谷');

>>>続きを読む

[SQL]特定の条件(店舗名・顧客名など)を指定して抽出する

条件を複数追加したい場合 → [SQL]条件(店舗名・顧客名など)を複数指定して抽出する

salesテーブルからstore_nameが「新宿」である行を抽出する。

>>>続きを読む

[SQL]特定の列を抽出する

注意:事前に件数やデータ量を確認してから実行すること。条件を指定して抽出する方法についてはデータ分析のためのSQL 目次を参照。

salesテーブルからカラムstore_nameを抽出する。

>>>続きを読む

[SQL]テーブルの全てを抽出する

注意:通常使うことは無いが、もし使う場合は事前に件数やデータ量を確認してから実行すること。条件を指定して抽出する方法についてはデータ分析のためのSQL 目次を参照。

mysql5.5

>>>続きを読む

「バズワードの栄枯盛衰モデル」を具体化してみる

バズワードの栄枯盛衰モデルというのを考えたが、モデルだけではよくわからないので、具体的にいくつかのキーワードについてこのモデルを当てはめてみる。なお、学術的調査を行っているわけではないので目下のところは独断と偏見に基づく。

(他も同じようなものだが)最近よく聞こえるけれどもなんだかよくわからないワードで次に来そうなのがマーケティングオートメーション。書籍も発売され露出も増えているようだがどうもいまいち盛り上がっていない感があるのは具体的にどう使うのかイメージができないからか。あれもこれもできると漠然としすぎても伝わらないので、もっと具体的な問題に対してどのような解決をすることができるか、を提案した方がわかりやすいのでは、というのがはたから見ての感想。

>>>続きを読む

データサイエンティストを雇う前にスキルについて考えるべきこと

データサイエンティストなどデータ分析者の募集を見ると、求められるスキルに「統計学」「機械学習」「データマイニング」などかなり漠然と分析手法についての記載しかないことも多い。では実際に話を聞けばわかるかというと、過去様々な企業の面接に行ったが分析が大事だとか力を入れるとは言いつつも、現在の状況・今後の展望・求めるスキルについて明確にしてくれ企業は記憶にない。要するに、企業側もよくわかっていないのである。

というわけで、先日データサイエンティストを雇う前に考えるべきことに「求めるスキルは何をどれぐらいか」という項目を追加したが、この部分についてもっと掘り下げて考えてみる。ちなみに前回追加したのは以下の通り。各項目についての詳細と、さらに追加で考えたことが続く。

>>>続きを読む

「データをいじくり回して何かわかった気になる症候群」から逃れる方法

目的なしにデータ分析をすることがどれだけ無駄であるかについてで「数字をいじくり回すのは楽しいので、気が付くとあっという間に時間が過ぎる。何かがわかった気にはなれるが、後には何も残らない。よほど意識していないとすぐこの状態に陥ることになるが、ためしにここ数日の間でデータを見ていた時間のことを思い出してみればいい。なんとなく数字を見て、今何か変わったことがあるだろうか?」と書いたが、これを「データをいじくり回して何かわかった気になる症候群」とでも呼ぼう。この状態に陥らないためにはどうするべきかを考える。

結局のところは目的を意識しているかいないかでこの問題はかなり解決する。目的を意識しないでデータを見ているというのは目的地を決めないで歩いているようなもので、歩いてはいるがその方向が正しいのかわかりようがないし、いつまで経っても無いところにはたどり着けない。散歩であれば散歩そのものが目的かもしれないが、ビジネスにおいて単にデータを見ることが目的ということなどありえない。なので「何を知るためにこのデータを見ているのだっけ?」を常に意識する。

>>>続きを読む

データサイエンティストが就職・転職で地雷を踏まないために注意すること

転職してみたら自分の持っているスキルと求められているスキルが違う、関係ないことばかりやらされる、求められる仕事のレベルが低すぎるなど、入社してから「こんなはずじゃなかった・・・」という話は後を絶ちません。もちろん、データ分析も例外ではありません。

というわけで、データ分析者が就職・転職するにあたり事前に対処する方法について考えます。なお、データサイエンティストに限らずデータアナリスト、Webアナリスト、リサーチャーなど分析関連の仕事であれば同じようにあてはまりますので自分に合わせて適度に置き換えてください。

>>>続きを読む

目的無きデータ分析は無駄である

何かいいことが見つかるかもしれないからと何の目的も無しにデータを見るのは時間の無駄である。データを見て何ができるかを考えるべきではない。最終的に様々な事情で今あるデータのみを使って考えざるを得なくなる場合は多々あるとしても、最初から可能性を限る必要はない。

データ分析は意思決定のために行われる。その意思決定は何等かの目的があるからこそである。目的が無ければどんなに数字をいじくりまわしたところで「それで?」で終わるだけになる。それは時間の無駄としか表現のしようがない。

>>>続きを読む

データサイエンティストの理想と現実

特にデータサイエンティストが顕著だが、どうも巷で喧伝されている姿と実態に大分乖離があるように思えるので、データアナリストなどデータ分析者の理想と現実について一覧にまとめた。

あえて両極端な場合を書いているが、もちろん現実にはどちらか一方ばかりというわけではない。人によって大分違うだろうが、全体的に見れば理想:現実=1:9か2:8あたりではないだろうか。

>>>続きを読む