データ分析とインテリジェンス

「安保法反対デモ 「共感せず」50%」は事実だけれども、印象操作に気を付ける・・・情報の読み方を考えるための具体例(3)

今日(2015年9月22日)の産経新聞で気になる記事が出てきた。この記事を見て喜んでいる声が聞こえるが、果たして本当なのかを検証する。

さて、本文には今回の世論調査の結果が書かれている。

>>>続きを読む

世論調査の調査方法と質問内容は公表できないのか

世論調査の結果が発表されるといつものごとく、政権に批判な人達は低めに出ている調査を中心にして高めに出ている調査をデタラメというし、逆に政権を支持する人達からは低めに出ている調査は偏向であり、正しくないという。平均を取ったら良いのかと言えば、傾向は分かっても数値はあてにならないだろう。これは各社独自で調査を行っており数値にぶれがあるためで、このぶれの原因が検証されたという話は聞かない。

自分に都合の良いデータを取るのはある程度やむを得ないにしても、高い・低いを議論する上での情報も無いので「自分が正しい」以外の根拠が無い。あとは互いに罵り合うか仲間だけで固まるかのどちらかで、どうにもならないというのが現状であり、この不毛な議論に費やされる時間は社会的な損害ではないかと思うのだが・・・。

>>>続きを読む

言葉から期待される内容と実際の意味の違いについて(分析編)

情報収集に関するまとめはこちら → 情報収集論・目次と概要

言葉の定義は重要である。何度読んでも聞いても話の内容が理解できない場合の原因と対策についてでもその理由の一つとして「同じ言葉を使っていても、同じ意味で使っているとは限らない」を上げたが、データ分析に関する言葉についても同様である。そこで、よく聞く言葉について、「その言葉から期待される内容」と「実際の意味」についてまとめる。やや極端に書いているので、中らずと雖も遠からずぐらいで読んでもらうのがいいだろう。

>>>続きを読む

何度読んでも聞いても話の内容が理解できない場合の原因と対策について

情報収集に関するまとめはこちら → 情報収集論・目次と概要

情報収集の際に「レポートに書いてある内容がつかめないな」とか「議論がかみ合わないな」という時に、何がおかしいのかを考えるために原因と対策を考える。

>>>続きを読む

安保法案報道における強行採決と憲法違反と民主主義・・・情報の読み方を考えるための具体例(2)

情報の読み方を考える上で具体的な例があった方がやはり分かりやすいので、「安保法案に反対94%」は信じてよいのか・・・情報の読み方を考えるための具体例(1)に続いて、今回も報道から情報を取る際に考えるべきことをテーマにしたい。

さて、今回の安保法案に関する報道であるが、法律の内容以前に、大きな違和感を持つキーワードが3点あった。「強行採決」「憲法違反」「民主主義」である。言葉はよく聞くのだが、記事を読んでもどうもよく理解できない。その理由を考えていたところ、いくらか整理できたのでそれぞれについて疑問点を述べる。

>>>続きを読む

「安保法案に反対94%」は信じてよいのか・・・情報の読み方を考えるための具体例(1)

今回読むのはこの記事になる。安保法案に反対94% 市民団体が「全国一斉投票」|カナロコ|神奈川新聞ニュース。この記事をそのまま鵜呑みにすると危険である。その理由は以下の3つ。

記事によれば投票もしくはホームページや郵送とのことであるが、1・賛成派と無関心層はわざわざ近寄らないだろう、と考えるのは自然であろうこと、2・この主催する市民団体に考え方が近く、団体の発信する情報に触れることがなければ、ホームページや郵送でできることを知ることもない、ということを考えれば、投票した人の多くは元々反対派ばかりではないだろうか、という疑念が残るのは当然。

>>>続きを読む

レポートやニュースで騙す方法とその対策のための基礎知識

情報収集に関するまとめはこちら → 情報収集論・目次と概要

グラフやレポートはもちろん、データ分析担当者としては世間の動きを見極めるために様々なソースから情報を集めなければならない。しかし、誰かが流す情報というのは何等かの意図が含まれていることが普通であるため、そのまま鵜呑みにすれば当然読み間違う。

>>>続きを読む

分析の結果がおかしいと思った時のチェックリスト

データを準備して、ツールに投入して実行したら、予想していたのとは大分違う結果が出てきて戸惑う、なんてことは日常茶飯事だが、その際どうやって検証したらよいかについてまとめる。

正しいデータを使っているつもりだったのに調べてみたら間違っていたというのが最も多いだろう。その内容も様々である。

>>>続きを読む

[SQL]重複を無くしてユニークな値を抽出

salesテーブルからsalesの一覧を大きい順に抽出

SELECT distinct sales FROM sales order by sales desc;

>>>続きを読む

[SQL]開始位置を指定して抽出

注意:開始位置は1行目が0、2行目が1・・・となる。

salesテーブルの3行目(池袋)から3件を抽出

>>>続きを読む