ベイズの確率論の勉強(2)

ベイズの確率論の勉強(1)の続きです。


今度は、最初の例題の条件から

  • 病気にかかっていない人に検査Tを適用すると、5%の確率で誤って病気にかかっていると判定される。

というのを

  • 病気にかかっていない人に検査Tを適用すると、100%の確率で正しく病気にかかっていないと判定される。

に変えてみたら、どんな結果になるでしょうか? つまり、

  • 病気にかかっている人に検査Tを適用すると、98%の確率で病気であると正しく判定される。
  • 病気にかかっていない人に検査Tを適用すると、100%の確率で正しく病気にかかっていないと判定される。
  • 人全体では、病気にかかっている人と病気にかかっていない人との割合はそれぞれ3%、97%である。

です。


さて、同じように計算をしていきましょう。


またまた、10,000人に登場してもらいます。
病気にかかっている人は10,000人の3%で、300人ということになります。この300人が検査Tを受けると、300人の98%で、294人が病気と判定されます。


一方、病気にかかっていない人は10,000人の97%なので、9,700人です。この9,700人が検査Tを受けると、100%の確率で正しく病気にかかっていないと判定されるので、病気と判定される人数は0人になります。


するとこういうことになります。

  • 本当に病気であって、検査Tでも病気と判定された人、294人
  • 本当は病気ではないのに、検査Tで病気と判定された人、0人


今度は、検査Tで病気と判定されたならば、100%本当に病気である、という結果になり、常識と合う結果になりました。やはり、前の2つの例題で常識と異なる結果になったのは「・病気にかかっていない人に検査Tを適用すると、5%の確率で誤って病気にかかっていると判定される。」という条件が原因だったようです。


最後に、最初の例題の条件から

  • 人全体では、病気にかかっている人と病気にかかっていない人との割合はそれぞれ3%、97%である。

というのを

  • 人全体では、病気にかかっている人と病気にかかっていない人との割合はともに50%ずつである。

に変えてみます。つまり、

  • 病気にかかっている人に検査Tを適用すると、98%の確率で病気であると正しく判定される。
  • 病気にかかっていない人に検査Tを適用すると、5%の確率で誤って病気にかかっていると判定される。
  • 人全体では、病気にかかっている人と病気にかかっていない人との割合はともに50%ずつである。

です。


計算をしていきましょう。


病気にかかっている人は10,000人の50%で、5,000人ということになります。この5,000人が検査Tを受けると、5,000人の98%で、4,900人が病気と判定されます。


一方、病気にかかっていない人は10,000人の50%で、やはり5,000人です。この5,000人が検査Tを受けると、5%の割合で病気と判定されるので、それを計算してみると、250人が病気と判定されることになります。


するとこういうことになります。

  • 本当に病気であって、検査Tでも病気と判定された人、4,900人
  • 本当は病気ではないのに、検査Tで病気と判定された人、250人

よって、この状況の場合、ある人が検査Tで病気と判定されたならば、この人が実際に病気にかかっている確率は

  • \frac{4,900}{4,900+250}=0.95

で、95%、つまり、ほぼ確実に病気、ということになります。これも、私たちの常識に合った結果になります。


以前の2つの例題では一見常識と異なる結果が出ましたが、これは正しい結果です。間違っているのは私たちの常識です。つまり、私たちは、検査Tをする前の、病気かどうかの確率(これをベイズの理論では事前確率というのですが)を軽視しがちである、ということのようです。そして、特に検査によって、病気でない人を病気であると誤って判断する確率が(少ないにしても)ある場合には、直感的な判断には注意が必要、ということのようです。


ベイズの確率論には反対者も多いそうです。その一番の理由は事前確率というもののあいまいさ、というところにあるそうです。しかし、上に紹介した例題から思うに、事前確率を適切に設定しないと私たちは間違った判断をするかもしれません。不正確かもしれないけれども、自分の知識や経験を元に事前確率を設定して計算することは、とても実践的であると思いました。結局のところ、確率の値が正確であるかどうか、よりも、判断が妥当であるかどうか、をより重視するのがベイズ確率論ではないか、と思いました。