ベイズの定理
確率の定義
1 ラプラスの定義:同様に確からしい根元事象を想定して計算
2 頻度に基づく定義(頻度論):大数の法則
3 主観に基づく定義(ベイズ統計学):主観確率
ベイズの定理
・時間をさかのぼって考える(熱が出たから風邪ではないか?)
・ベイズの定理で求めているのは、条件付き確率である。
ベイズの定理 応用例
・迷惑メールの判別
・機械学習
・病気
など
ベイズの定理(公式)
ベン図
Aの起こる事象を円Aで表すと、Aが起こる条件の下でBの起こる確率は、円Aと円Bの重なる箇所となる。
※ベン図 A∩B≠0 のとき
Aの起こる条件の下でBの起こる確率は、次の式で求められる。
$$P(B|A)=\frac{P(A \cap B)}{P(A)}・・・① ※P(A) ≠ 0$$
同様に、Bの起こる条件の下でAの起こる確率は、次の式となる。
$$P(A|B)=\frac{P(A \cap B)}{P(B)}・・・② ※P(A) ≠ 0$$
これを乗法定理という。
この式を変形すると、
$$P(A \cap B)=P(B)P(A|B) ※P(A) ≠ 0$$
となり、これを①の式に代入すると、
$$P(B|A) = \frac{P(B)P(A|B)}{P(A)}・・・③$$
となる。
分母のP(A)は、
$$P(A \cap B_1)+P(A \cap B_2)+・・・+P(A \cap B_k)$$
と考えることができる。
この式を乗法定理を使って表すと、
$$P(B_1)P(A|B_1)+P(B_2)P(A|B_2)+・・・+P(B_i)P(A|B_k)$$
となり、これを③の式に代入してまとめると、
$$P(B_i|A) = \frac{P(B_i)P(A|B_i)}{ {\displaystyle \sum_{j=1}^{n}} P(B_j)P(A|B_j)}$$
が導き出される。これをベイズの定理という。
なお、
P(Bi):事前確率(prior probability)
P(Bi|A):事後確率(posterior probability)
とよぶ。
ベイズの定理 具体例
メールに含まれる文字情報で、これまでの情報から80%が正常のメール、20%が迷惑メールであることが分かっていた。今回の調査では、ある文字が使われていた場合、正常のメールである確率は20%だが、迷惑メールである確率は80%となっていた。この文字を含んでいるメールが迷惑メールである確率はどのくらいか。
・ある文字が含まれている確率は、
0.8×0.2+0.2×0.8=0.32
・そのうち、迷惑メールである確率は80%なので、
0.2×0.8/0.32=0.5