こんにちは、「コボヒロ」です。
渋谷を歩いている20代〜30代の社会人100人に「1日どのくらい勉強していますか?」
というアンケートを取ったところ、1日に勉強する平均時間は「10分」だったというデータがネットニュースにのっていました。
みなさんはこのデータを見て、
「なんだ、勉強していないのは私だけじゃないんだ。」
と思いますか?それとも、
「私は1日に30分も勉強やってるから優秀じゃん。」
と考えますか?
そしてあなたは本当に、
20代〜30代の社会人が「10分」しか勉強していないと信じますか?
断言します。
あなたは騙されています。
序章はこのくらいにして、さっそく見ていきましょう。
統計のマジックに騙されるな
先ほどのデータ、なにをどのように騙していたのでしょうか?
パッと見ると違和感ないように思えますが、
統計学を学んでいる人からすると、怪しい匂いがムンムンします。
怪しいポイントは3つあります。
1.性別や職業を公開していない
100人の内全員が男性かもしれないし、全員が女性かもしれません。
会社員かもしれなし、アパレル関係の人かもしれないし、ニートかもしれないし、バイトの人かもしれませんよね。
それの比率を公開していないデータを妄信的に信じるのは危険です。
2.なぜ渋谷でアンケート調査を行ったのか?
渋谷で遊んでいる多くの若者は、勉強なんかしているより、他にもっと面白いことがあります。
社会人の若者のことで正確なデータを取るなら、丸の内とかでとったほうが正確です。
20代〜30代の社会人100人に「1日どのくらい勉強していますか?」というアンケートを、
丸の内にいる若者ではなく、渋谷で遊んでる若者に聞いている時点で、
故意的にデータを操作しているのかな?と思ってしまいます。
3.平均という言葉を使っている
「平均」という単語は、かなり信頼できる単語のように聞こえますが、
多くの場合は信頼できません。
悪意のある人が使うと、無知な人を蹂躙できる最強の武器に変わります。
人をだます学問、それが「統計学」
騙されないで相手を騙す学問、それが統計学です。
サンプルやアンケートを取るときには必ず「偏り」というモノが発生します。
「コインを投げて表裏の確率は50%」みたいなモノが確率になります。
しかし極希に、「連続して表が5回続くことがある」というモノが「偏り」になります。
コインの場合は確率の中で偏りが発生するのですが、
アンケートでは悪意を持って偏りを発生させることが可能です。
さきほどのたとえであげた、
渋谷を歩いている20代〜30代の社会人100人に「1日どのくらい勉強していますか?」みたいなアンケートは、
ぱっと見は、100人という数を担保にして、信頼できそうなアンケートに見えますがそんなことはありません。
あなたがネットニュースの記事を書く場合、どんなデータが欲しいですか?
少し考えてみてください。
・
・
・
記事の内容にもよりますが、
「短い時間しか勉強していません。みんなもっと勉強しましょう。」なら、短い時間のデータが必要で、
「長い時間勉強しています。少し息抜きしませんか?」なら、長い時間のデータが必要です。
このどちらかになると思います。
では、その記事の方針にそったデータをどうやって取りますか?
ココで先ほど説明した偏りの出番です。
キモはデータのとり方にある
ここからは「短い時間しか勉強していません。みんなもっと勉強しましょう。」の方針の話をしていきます。
ぼくなら、
「全身ハイブランドに身を包んだ若者」100人に聞きます。
なぜなのか?というロジックは、
①勉強時間が短いデータが欲しい
↓
②勉強してなさそうな人100人を選びたい(バカっぽい人100人)
↓
③全身ハイブランドに身を包んでいる人
物凄くテキトーの言いましたが、論理的展開はこんな感じです。(雑ですいません。)
そのデータをネットで見ている人は
「なんだぼくだけじゃなくて、みんな勉強していないんだ。」
と誤解してしまうんですけど、実はみんなめっちゃ勉強しています、
みたいなギャップが生まれてしまいます。
でも普通に考えたら、
「勉強しないと稼げないからぼくは頑張ろ。」
と考えるんですけど、
「信頼できるサイトの情報は絶対!」
みたいな人が一定数いるのが残念です。
テレビだと、さらに信頼度が上がって妄信的にどんな情報でも信じてしまいます。
テレビなんて情報操作の塊
だから、信頼性のないデータとかテレビなんて見ない方がいいです。
アンケートに答えた80人が道行くおじいちゃんのアンケート結果と、
アンケートに答えた80人が20代の若者のアンケート結果、
果たして同じ結果のなるでしょうか?
80人が女性だったら?
80人が男性だったら?
決して結果を公正とは言えないハズです。
ではその偏りをどうやって排除すればいいのか?
それを正しく学ぶのが本来の統計学の姿です。
しかし、それを悪用しているのが政治家やテレビです。
平均値と中央値の違い
よく悪用されているのが、平均値と中央値です。
たとえば、
日本人の世帯平均収入が420万。
日本人の世帯収入の中央値は250万。
この違いが分からないのならば、あなたは騙されている可能性があります。
続きが気になる方は、こちらの本をのぞいてみてください。
↑マンガでわかる統計学
とても分かりやすい初心者向けの1冊です。
数学が苦手なぼくでもサクサク読めたのでオススメです。
ちなみに、、、
まとめ
世の中に出ているすべての数字を、何の疑いもなくすべて信用するのは危険です。
疑いながら生きるのは、めんどうさくて、生きづらいのですが、
ぼく自身何度も痛い目にあっているので、みなさんは痛い目に合う前に、
おかしな数字は見抜いて危険を回避してください。
みなさんと次の記事でお会いできるのを楽しみにしています。
でわまたっ!良い会社員生活を(^^)