全確率の定理とベイズの定理
「結果から原因を推測する」全確率の定理とベイズの定理を具体的な病気検査の例で学びます。
このモジュールで学ぶこと
「病気の検査で陽性と出ました。では、あなたが本当に病気である確率はどのくらいでしょうか?」——直感では「陽性=ほぼ病気」と思いがちですが、実際は検査の精度と病気の希少さによって大きく変わります。この問いに答えるために、原因を複数に分けて確率を計算する「全確率の定理」と、結果から原因を逆算する「ベイズの定理」を学びます。
「複数の原因」を考えるための準備
前のモジュールで条件付き確率と独立を学びました。次のステップは「複数の原因があるとき、それぞれの寄与を足し合わせて全体の確率を求める」方法です。これが全確率の定理の発想です。
乗法定理と全確率の定理
条件付き確率の定義を変形すると、積事象を「段階的に計算できる」乗法定理が得られます:
例:袋に赤玉3個・白玉2個。1個取り出して戻さずにもう1個取る。2個とも赤の確率は?
次に、互いに排反で全事象を分割する事象の組 (これを完全系と呼びます)を使うと、任意の事象 の確率を次のように表せます——これが全確率の定理(Total Probability Theorem)です:
例:工場Aが製品全体の60%、工場Bが40%を生産。不良品率はそれぞれ2%・5%。無作為に選んだ1個が不良品である確率は?
全確率の定理は、各原因 からの寄与()を足し合わせる構造です。次のベイズの定理の分母の計算に必ず登場します。
ベイズの定理:「結果から原因を推測する」
全確率の定理で「全体の確率」が計算できました。次は逆方向——「結果を観測したとき、各原因がどのくらい疑わしいか」を問います。これが統計的推測の核心です。
冒頭の問いに戻りましょう。3つの数値を整理します:
有病率 1%:検査を受ける人1000人のうち、実際に病気なのは10人
感度 95%:病気の10人中 9.5人(≈9人)が「陽性」と正しく検出される
特異度 90%:健康な990人中 891人が「陰性」と正しく判定される → 残り 99人が誤って「陽性」(偽陽性)
つまり「陽性と出た人」は約 人いるのに、本当に病気なのは9人だけ——直感より大幅に低い値になりそうです。ベイズの定理で正確に計算します:
分母を全確率の定理で展開します(健康な人が陽性になる確率 ):
よって:
陽性でも約9%しか病気でない——有病率(検査前に病気である確率)が低いと、感度が高くても「陽性だったときに病気である確率」は大きく上がりません。
ベイズの定理の一般形:
:事前確率(Prior Probability)——観察前にわかっている確率
:尤度(Likelihood)——原因 のもとで結果 が起きる確率
:事後確率(Posterior Probability)——結果 を観測した後に更新された確率
分母 はすべての に共通の定数です。そのため事後確率の大小関係は分子 だけで決まります。これを利用して「(比例する)」という簡略表記が使われます:
実際の確率値が必要なときは分母で割って正規化します——この意味で分母を正規化定数(normalizing constant)と呼びます。分母で割ることで「すべての にわたる事後確率の合計が1」になることが保証されます。
試験頻出:「事前確率 × 尤度 に比例して事後確率が決まる」、「分母は正規化定数」、「 は分母が定数なので省略できる」という3点はベイズ統計の土台として頻出です。
確認クイズ(抜粋)
Q1. ベイズの定理 において、 を何と呼ぶか?
A. 事前確率
Q2. 工場Xが製品の70%を作り不良率2%、工場Yが30%を作り不良率6%のとき、無作為に1個選んだ製品が不良品である確率はいくらか?
A.
Q3. 袋に赤玉4個・青玉2個。1個取り出して戻さずにもう1個取る。両方赤の確率はいくらか?
A.
全10問のクイズはサイトのインタラクティブ版でお試しください。
第1章の他のモジュール
※本サイトは個人による学習支援サイトであり、統計質保証推進協会・日本統計学会の公式サイトではありません。