データ分析とインテリジェンス

データサイエンティストはSEであるべき・・・か?

■題名が疑問形なのは多分そうなんだろうけどまだ勉強不足で確信が持てていないから

最近簡単なツールを作って人に渡す機会が増え、どうしたらうまくできるかを考えることがあったり(よくよく考えてみればそれまさにSE兼プログラマの役目)、システム・ツールの導入に失敗して炎上する様子を横目で見ていて、なぜだろう?と疑問がわき、システム構築関連の書籍をいくらか読んでいたところ、「これはデータ分析も同じではないか?」と感じたのがきっかけである。

ツールの作成は、コミュニケーションやユーザーのレベルに合わせたアウトプットの作成、業務フローの確認といった分析やプログラミングとはまったくかけ離れた業務を行わないと、ユーザーにとって使いにくかったり最悪の場合は誰にも使われないという事態になるのは正しく使えば正しく動くだけのツールは不良品であるに書いたが、これはそのままシステム構築の話と同じだった。

したがって、データサイエンティスト・データアナリストには要件定義から開発まで、少なくともITを利用する部分においてSEのスキルがどうやらそのまま役に立つようだ。例の如く「コミュニケーション能力」という問題はあるが、それさえクリアできればSEスキル習得が生産性やキャリアアップにつながるのではないだろうか。

きちんと整理できるまでにはまだ勉強が必要なのだが、今のところ感じていることだけでもまとめておいて損はなさそうなので、まずは書いておくことにする。なお、SEに関しては業界にいたわけではなくユーザーとして接していたり、書籍や業界の人から聞いた話が主な情報源なので直接内情を見ているわけではなく、勘違いしている部分もあるかもしれないことを先にお断りしておく。

■データ分析に限らず本質は全ては同じ

SEやデータ分析といったITに関わらず全ての製品には目的、設計、メンテナンスがあり、方法も既製品からオーダメイドがあり・・・と考えると、何もデータ分析やシステム構築が特別であるということはないだろう。

その認識に立てば、ベンダーがサイズの合わない靴を売って足のサイズを合わせろと押し付けるとか、一方でユーザーは大量生産するから安い既製品にあれこれ無料でカスタマイズしろという無茶を言ったりなどということは無くならないにしてもかなり減るだろう。それがかなわないのは、まだ数十年の歴史しかないIT業界もユーザーも未熟である上に、「直接見える触れるものには強く、そうでないものには滅法弱い」日本人の特性が重なって悲惨な事態になっているのではないだろうか。

その状況が俯瞰できれば、データサイエンティストもユーザー(それは本人がアドホックで作る場合も例外ではない)にとって何が大切であり、どうしたら価値が出せるかを考えねばならない。とはいえデータ分析業界の歴史など本当に始まったばかりで知識やノウハウの蓄積もほとんどない。であれば、他の業界から学ぶのが一番だ。

■それではなぜSEであるべきか

そしてその業界というのがITであり、特にSEというのが答えである。本質は同じならどの業界から学んでもよいのではないか?という疑問に対しては「間違いはないだろうが、より近い業界で学ぶ方がよいのでは」ということで、SE業界を学ぶのが良いと思われる理由は以下の通り。

アウトプットが抽象的という共通点がある

第一に、SEとデータサイエンティストにはアウトプットが抽象的という共通点がある。前述のようにユーザーの不条理な要求というのはこのITが「見えない、手に取れない」という点に起因している部分が大きいと考えられるが、データ分析も途中で扱うのはデータであり、最終的に「知識」という抽象的なアウトプットになることを考えれば似たようなものであろう。実際、「なんだかよくわからないから」とか

過去の蓄積がありそれを適用できる

第二に、過去の蓄積がありそれを適用できること。SEやIT業界はまだ生まれて数十年であるにも関わらず、これだけ失敗について話題になる業界も珍しいのではないか。そこには過去の失敗事例の蓄積が大量にあり、それを学ぶことで・・・ただし、ブラックやなんだと単なる自虐的なネタで笑いを取るだけでなんら解決手段の提案もないような書籍は読んだところであまり学ぶことはなさそうだ。

専門性が強く関係者にしか理解できないことが多い

第三に、専門性が強く関係者にしか理解できないことが多い。ということは専門家の中だけで通じる言葉を使って内輪で閉じこもり、ユーザーを馬鹿にした目で見て顰蹙を買うというITの失敗で同じことが起きる可能性が考えられる・・・どころかもうすでに起きている。これがコミュニケーションの断絶とプロジェクトの崩壊を招くことはすでにあちこちで示されており、データ分析が同じ轍を踏むのは実に愚かしいことではないだろうか。

歴史が浅く業界もユーザーも未熟

そして最後、歴史が浅く業界もユーザーも未熟であり、お互いにでたらめな仕事や理不尽な要求がまだまだまかり通る。ユーザーの無知をいいことに単なる集計に○○分析と名前を付け作文で構成されただけの結果を数百万円で売ったなどという話を聞くとうんざりするが、ユーザーの知識や経験がないので当面 将来は分析に対してもITシステムと同様な法整備がされることが予想されるが、ベンダーやユーザーの責任などについても参考になるのではないだろうか。

■データサイエンティストのキャリアの1つとして

以前からデータサイエンティストを初めとして分析についての話題が手法とテクノロジーに偏りすぎていることは気になっており、こういった実務のための記事はあまり見当たらない。分析に関わって大分経つのだが、最初に必要なのはデータサイエンティストではなくデータ分析プロセスをマネジメントする人だけでは物足りなかった部分が埋められる気がする。そして、この2つのスキルがあればデータサイエンティストやデータアナリストにとってのキャリアとして1つの選択肢になり得るのではないだろうか。

とはいえ統計学や機械学習とはまったく別スキルであり、両方をそれなりに身に着けるのは結構大変で、かといって一方だけではあまり役に立たずという中で、どのようにするべきかは今後の課題であろう。

少々疑問形の多い文章になってしまったが、もうしばらく勉強してきちんと消化できたら改めよう。

このエントリーをはてなブックマークに追加

タグ:データサイエンティスト キャリア SE スキル


最新のブログ記事5件

大学や独学でデータ分析の勉強をしただけだと実務で使えない理由
「データ分析をする人」とは何をする人のことを指しているのか
定期レポートを効率化する
最悪のデータ分析組織とは
「何を知りたいのか」がわからなければデータ分析は始まらない

ブログトップ > データサイエンティストはSEであるべき・・・か?