ベイズの理論が変える「確率」の使い方:「ベイズな予測」で未来を拓け(1)(2/2 ページ)
量子力学などの最先端科学分野では、統計学の客観的確率では説明がつかない矛盾が生じ始めている。ここでは「主観的確率」について研究する「ベイズの理論」について、マイクロソフトのシニアテクニカルアーキテクト、宮谷隆氏に解説してもらう。
アタリの確率が変化する?
客観的確率の矛盾は日常でも簡単に起こる。子供との遊びを例にとって紹介しよう。10枚のカードを並べる。この中の1枚にジョーカーを入れてあり、その場所を親は知っている。子供に1枚カードを選ばせる。そのカードは裏返さずに、ジョーカーではない別のカードを6枚裏返す。そして子どもに「6枚はずれたが、カードを変更するかどうか」を尋ねるのだ。果たして、あなたならカードを変更するだろうか。
一般的に客観的確率を学んだものであれば6枚裏返ったところで、カードを変更する意味がないとすぐに思うだろう。最初にカードを選んだ時の1/10の確率は、6枚がはずれと分かって1/4に変化したが、ここでほかのカードを選び直したところで、アタリとなる確率は1/4のはずである。カードを変更する意味がないといえそうである。
しかし、果たして、本当にそうだろうか?
主観的確率では次のようにプロセスを追う。最初に選んだ時の確率は1/10だった。すると残りの9枚にアタリがある確率は9/10ということになる。ここで、この9枚のうち6枚はハズレていることが明らかになった。主観的な考え方では、6枚がハズレと分かった時点で残りの3枚のカードに9/10の確率が移動することになる。
従って、9/10を3で割ることになり、確率は3/10(30%)となる。客観的確率、1/4(25%)と異なってくる。主観的確率ではカードを変更したほうが有利だ。しかも最初に選んだ時の確率(1/10)と比較すればカードがアタルという確率は3倍にもなっている。これならカードを変えない手はない。
書籍「ベイズな予測」で紹介した「ベイズの定理」に当てはめてみよう。
H(仮説)に代入するのは、最初に選んだカード以外の9枚のカードのいずれかがアタルとする確率、事象Hが起こる確率だ。下のベン図を確認してほしい。9/10である。
次に、新しい情報が手に入った。6枚のカードのハズレが明らかになったのだ。これは情報量の増加であり、条件付きの確率P(E|H)を求めることができるようになったことを意味する。P(E|H)は仮説Hのもとで証拠Eを示す確率である。残りのカードは(HとEの交わりに)3枚存在する。この中のカードがアタリとなる確率は、
一方、P(E)は事象E(証拠)が成立する際のスケールとなる。ここでは、6枚のハズレが観測された後なので、事象は成立したとする。
すべての変数がそろったので、ベイズの定理に代入すると主観的確率を得られる。
ベイズ確率では、カードを変えた状態における母集団の確率を仮説として求め、これを新たな証拠で更新して結果を得ている。
参考までに記すが、母集団の変化や情報取得のプロセスを無視して、Conditionを必ず起きる固定の状態とすれば、P(H|E)=P(H)P(E|H)/P(E)となる。HをAに、EをBに変更すれば、P(A|B)= P(A)P(B|A)/P(B)となる。
誰もがよく知る(客観的)確率は、母集団を固定値と決めて確率を求めてしまう。
一方、主観的確率では母集団そのものの不確定性を考慮できる。母集団に対する確率を求め、その確率に対して新たに取得した情報、条件などによって確率を更新する機能を内包しているのだ。これが客観的確率とベイズ確率との決定的な違いである。
母集団の不確定性を考慮したベイズ推定は、例えば5000万件の「消えた年金」に対する適正受給者の推定といった、母数全体が分からない問題の解決に活躍する。不確定な時代のニーズに応える計算機科学だ。
企業向け情報を集約した「ITmedia エンタープライズ」も併せてチェック
著者プロフィール:宮谷 隆(みやたに たかし)
マイクロソフト株式会社 シニア テクニカルアーキテクト。日本シリコングラフィックスにて、データマイニング製品MineSetのエンジニア兼プロダクトマネージャを務め、要因分析や予測販売などのソリューションを提供した。マイクロソフトでは、現在のクラウドコンピューティングの先駆けとなった「Hailstorm」の啓発活動を2001年から展開、.NET FrameworkやSQL Server のデータマイニング機能をはじめ、RFIDなど最新技術の啓発活動を行ってきた。現在は、主にWindows Azureを使ったクラウドコンピューティングの啓発活動を推進している。また、政府向けに経済産業省や総務省の協議会における技術標準策定に関わっている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- スパムへの終止符は誰が打つべきか
日々届き続けるスパムメール。このまま自ら排除し続けるしか手段がないのか? ウイルスと違い断定基準の難しいスパムだが、排除するためのポイントが幾つかある。 - スパム対策に欠かせないベイズ理論とは?
スパム対策ソフトの多くが採用するベイジアンフィルターの基本的な考え方を紹介する。(IDG)