2014年03月10日

確率で人を上手に騙す例

今日は、20日に1度の数学記事の日です。(実は、経済関係と数学関係の記事をそれぞれ20日に1度くらい書くという独自ルールを自分の中で作っていました。)という事で、今日は確率で人を上手に騙す一例をご紹介します。



↑は、A市におけるB社の天気予報結果とC市におけるD社の天気予報結果です。ここでは話を簡単にするために、天気を「晴れ」「雨」だけとして、予報の天気と実際の天気を表にして各確率を出しています。

さて、ここで問題となりますが、天気予報として性能が良いのはB社の天気予報かD社の天気予報かどちらでしょうか?

一応↑画像中の参考として、天気予報の的中率が各60%と68%と出ています。これだけ見ると、D社の天気予報の方が的中率が高いので、天気予報としての性能が良さそうに思えるわけですが、実はこれは大きな間違いです。


何故B社の天気予報の性能の方が良いのかここから説明しようかと思いますが、まずはA市におけるB社の天気予報の結果を見てみましょう。
A市が実際に晴れた日の確率は(a+b)=0.5である一方で、天気予報が晴れの条件の下で実際の天気が晴れた確率はa/(a+c)=0.6 になります。つまり、天気予報の情報がない場合で晴れる確率よりも、天気予報で晴れるという情報がある場合で実際に晴れる確率が、10%程度高くなるわけです。
同様に、A市が実際に雨だった確率は(c+d)=0.5である一方で、天気予報が雨の条件の下で実際の天気が雨だった確率はd/(b+d)=0.6 になり、これも天気予報で雨という情報があることで、実際に雨である確率が予報のない場合と比較して10%上がります。

一方で、B市におけるD社の天気予報はどうでしょうか?B市が実際に晴れた日の確率は(A+B)=0.8である一方で、天気予報が晴れの条件の下で実際の天気が晴れた確率はA/(A+C)=0.8になります。つまりD社の天気予報では、天気予報で晴れという情報があってもなくても、実際に晴れる確率は同じく0.8で同じとなります。また、B市が実際に雨だった確率は(C+D)=0.2である一方で、天気予報が雨の条件の下で実際の天気が雨だった確率はD/(B+D)=0.2になり、こちらも天気予報で雨という情報があろうがなかろうが、実際に雨が降った確率は0.2と変わりません。
種明かしを書けば、D社の天気予報は実際の天気と関係なく、晴れと雨を80%と20%でランダムに出すだけのインチキシステムです。


要は、C市で実際に晴れるか雨になるかの確率に偏りがある事に起因して、的中率という数字だけ見てるとD社の天気予報の方が優秀に見えるって話ですね。大事なのは的中率ではなく、天気予報が無い時の確率から、天気予報の情報があるという条件の下でどの程度条件付確率が上昇するかという事です。

ちなみにこれ(条件付確率・ベイズの定理・情報理論(相互情報量)等々)は天気予報だけでなく、新薬の効果測定やファイル圧縮技術等の基礎理論になっていて、応用範囲が非常に広い話だったりします。人間の直感に頼ると大きな間違いを犯しかねないという良い例ですかね。


多少なりとも参考になった方は、↓のクリックをお願いします。
にほんブログ村 海外生活ブログ スイス情へ
にほんブログ村
posted by もんじゃ at 15:10| Comment(0) | TrackBack(0) | 数学