病気の確率はどのくらい? – ベイズの定理の例題

2018年3月29日

この記事ではこんなことを書いています

確率のパラドックスとしてよく話題になる、”病気の確率”の問題を紹介します。

まずは、問題を紹介しその要点をみていきます。

次に、難しい数学は使わずに問題を解いてみます。

最後に、この”病気の確率”問題をベイズの定理を使って解く方法を解説します。

スポンサーリンク

”病気の確率”ってどんな問題?

確率のパラドックスとして、よく持ち出される問題に、”病気の確率”があります。

それは、このようなものです。

病気の確率のパラドックス

あなたは病気(がん)がないかを調べるために、がん検査を受けました。

がん検査の結果、あなたはがん(病気)の検査で、

「陽性反応(がんの疑いがある)」

という診断結果が出てしまいました。

まだ、これからきちんとした精密検査を受けなければ、本当に病気(がん)であるかは分かりませんが、これまでのがん検査では以下のことが分かっています。

  • (要点その①)がん検査で本当に病気(がん)の人が、陽性反応が出る確率は\(90\)%である

ということです。

つまり、実際に病気(がん)の人は\(90\)%の確率で、がん検査で見つかるのです。これは、高い確率であると言えます。

 

また、次のようなことも分かっています。

  • (要点その②)精密検査を受ける人の1000人に1人は、実際に病気(がん)にかかっている
  • (要点その③)本当は病気(がん)にかかっていないのに、陽性反応が出る確率は\(10\)%

ということです。

さて、あなたはどのくらいの確率で本当に病気(がん)でしょうか?

(その①)と(その③)から、本当に病気であって、がん検査で陽性反応が出る確率が\(90\)%なのに対して、本当な病気ではないのに、陽性反応が出る確率は\(10\)%と低いです。

これは、「高確率で自分は病気なんじゃないか?」と思って落ち込んでしまいますよね?

 

では、実際はどうなのでしょうか?よく考えていきましょう。

 

スポンサーリンク

病気の確率パラドックスの考察

まず、三つの要点をもう一度整理しましょう。

  • (要点その①)がん検査で本当に病気(がん)の人が、陽性反応が出る確率は\(90\)%である
  • (要点その②)精密検査を受ける人の1000人に1人は、実際に病気(がん)にかかっている
  • (要点その③)本当は病気(がん)にかかっていないのに、陽性反応が出る確率は\(10\)%

その①は、実際に自分が病気だった場合、非常に高い確率で陽性反応が出ることが分かります。ここで注意すべきは”実際に自分が病気だった場合”ということですね。

その②は、病気にかかっている人は1000人に1人という非常に稀であるということです。病気の人は\(0.1\)%ということです。

その③は、病気でないのに間違って陽性反応が出る確率は\(10\)%と、陽性反応が間違って出る確率は低いということが分かります。

 

これを樹形図にしてみましょう。

はじめに、あなたが”本当に病気なのか、病気ではないのか”で枝分かれします。これは、どちらに進んだのかはまだ分かっていません。

次に、がん検査の結果です。陽性か陰性かで分かれます。

あなたはいま、陽性反応を受けていますので、この分岐は陽性の方へ進みます。

ということは、上の樹形図の①か③の状態です。これらは、

  • 状態①:本当に病気で、陽性反応が出ている
  • 状態②:本当は病気ではないが、陽性反応が出ている

という状態です。

あなたは、状態②であって欲しいと願っています。

 

それぞれの確率は樹形図より、

  • 状態①:\(0.09%\)
  • 状態③:\(9.99%\)

です。

このどちらかの状態にあなたはいますので、状態①(本当に病気)である確率は、

$$\text{本当に病気である確率} = \frac{0.09\%}{0.09\% + 9.99\%} = 0.008928571\cdots \simeq 0.89%$$

となります。

 

よって、陽性反応が出た場合で、本当に病気である確率は\(1\%\)にも満たないということがわかりました。

ひと安心ですね。(本当に病気である可能性は残っていますが…)

 

ベイズの定理で解いてみよう

このように、”結果”があってその”原因”の確率を数学的に計算するには、”ベイズの定理”というものが使われます。

この場合の”結果”というのは”陽性反応が出た”ということで、”原因”は本当に病気(がん)であるということですね。

ここでは、ベイズの定理を使って、上記で紹介した病気の問題を数学的に解いてみましょう。

ベイズの定理を知らない人は、まずは以下の記事を読んでみてくださいね。

 

ベイズの定理の公式は、以下のようなものでした。

\begin{align}
Pr(B_i|A) & = \frac{Pr(A|B_i)Pr(B_i)}{\sum^k_{j=1} Pr(A|B_j)Pr(B_j)} \\
\\
Pr(B_i|A) & \text{:事象\(A\)が起こったという条件のもとで、事象\(B_i\)が起こる確率} \\
Pr(A|B_i) & \text{:事象\(B_i\)が起こったという条件のもとで、事象\(A\)が起こる確率} \\
Pr(B_i) & \text{:事象\(B_i\)が起こる確率} \\
k &  \text{:起こり得る事象の数}
\end{align}

ここで、事象\(A\)と事象\(B\)は次のようにします。

  • 事象\(A\):がん検査で陽性反応が出る
  • 事象\(B_1\):病気(がん)である

このように置けば、

ベイズの定理の左辺が、

Pr(B_1|A) & \text{:”がん検査で陽性反応が出た”という条件のもとで、”本当にがんである”確率}

となり、求めたい確率を得ることができそうです。

 

また、事象\(B_1\)は”病気(がん)である”としたので、事象\(B_2\)は”本当は病気ではない”としましょう。

  • 事象\(B_1\):病気(がん)である
  • 事象\(B_2\):病気(がん)ではない

事象\(B\)の数はこの二つだけなので、\(k=2\)となり、ベイズの定理は以下のように書けます。

\begin{align}
Pr(B_1|A) & = \frac{Pr(A|B_1)Pr(B_1)}{\sum^2_{j=1} Pr(A|B_j)Pr(B_j)} \\
Pr(B_1|A) & = \frac{Pr(A|B_1)Pr(B_1)}{Pr(A|B_1)Pr(B_1) + Pr(A|B_2)Pr(B_2)}
\end{align}

 

まずは、\(Pr(B_1)\)(病気である確率)ですが、これは1000人に1人ということが、”要点その②”から分かっていますので、

$$Pr(B_1) = \frac{1}{1000} = 0.001$$

です。

また、\(Pr(B_2)\)(病気ではない確率)は、1000人中999人は病気でないので、

$$Pr(B_2) = \frac{999}{1000} = 0.999$$

です。

次に、\(Pr(A|B_1)\)(本当に病気であるという条件のもと、陽性反応が出る確率)は”要点その①”から\(90\%\)であることが分かっているので、

$$Pr(A|B_1) = 90\% = 0.9$$

です。

最後に、\(Pr(A|B_2)Pr(B_2)\)(本当は病気ではないという条件のもと、陽性反応が出る確率)は”要点その③”から\(10\%\)であることが分かっているので、

$$Pr(A|B_2) = 10\% = 0.1$$

です。

 

これらをベイズの定理の式に代入すると、

\begin{align}
Pr(B_1|A) & = \frac{Pr(A|B_1)Pr(B_1)}{Pr(A|B_1)Pr(B_1) + Pr(A|B_2)Pr(B_2)} \\
& = \frac{0.9 \times 0.001}{0.9 \times 0.001 + 0.999 \times 0.1} \\
& = \frac{0.0009}{0.0009 + 0.0999} \\
& = 0.00892857\cdots \simeq 0.89\%
\end{align}

と前節で求めた確率を求めることができました。

これが、”病気の確率”パラドックスをベイズの定理で求める方法です。

 

スポンサーリンク

まとめ

  • ”病気の確率”パラドックスは、人間の確率に関する直観がいかにあてにならないかを教えてくれる問題
  • 要点を一つ一つ理解して、樹形図にすれば解ける
  • ベイズの定理を使えば、数学的に”病気の確率”の問題を証明できる

※コメントの反映には少し時間がかかります

スポンサーリンク