確率木って便利ですよね・・・?

この記事は統計学 Advent Calendar 2022 24日目の記事です!

確率木というのを Head First Statistics という本で知りました。

条件付き確率とベイズの定理について確率木を使うとすごく分かりやすいなぁと思ったのですが、この本以外では見かけたことがなく何か良くない点もあるのでしょうか・・・?もしあるなら知りたい・・・!

確率木を使ってみる

例として、統計Webの問題をやってみます。

3つの袋があり、次のように赤い玉と白い玉が入っています。

  • 袋1:赤い玉4つ、白い玉1つ
  • 袋2:赤い玉3つ、白い玉3つ
  • 袋3:赤い玉2つ、白い玉4つ

いずれかの袋から玉を1つ取り出したところ、白い玉でした。この玉が袋2から取り出された確率はいくらでしょうか。

10-4. ベイズの定理 | 統計学の時間 | 統計WEB

まず3つの袋のどれかを選びます。次にそれぞれの袋について赤or白を選びます。これを以下のような木で表現します。

確率木の枝に、その枝が選ばれる確率を書きます。袋はどれを選ぶ確率も同じ  1/3 です。

枝の確率をすべて足すと  1 になりますね。

確率木は1つの節から生えている枝の確率をすべて足すと  1 になります。例えば、袋1から生えている各枝の確率をすべて足すと  1 です。

袋1には、赤い玉4つ、白い玉1つ、全部で5つ入ってます。袋1から玉を1つ取り出すとき、赤い玉の確率は  4/5 、白い玉の確率は  1/5 です。袋2, 3についても同じように確率が分かるので、それぞれ確率木に書き込みます。

根から袋1の枝の確率は  P(袋1) = 1/3 、袋1から白の枝の確率は  P(白|袋1) = 1/5 です。葉の位置する「袋1かつ白」となる確率  P(袋1 \land 白) は葉に至るルートの確率をすべて掛け算すればいいことになります。

白玉を選ぶ場合の確率をすべて書き込みます。

知りたいことは、 いずれかの袋から玉を1つ取り出したところ、白い玉でした。この玉が袋2から取り出された確率はいくらでしょうか。 なので以下の条件付き確率を求めます。

 \displaystyle
P(袋2|白) = \dfrac{P(袋2 \land 白)}{P(白)}

分子の値はすでに分かっています。分母の  P(白) 、つまり白玉を取り出す確率は、確率木を見ると白玉を選ぶ葉の確率を全部足せば良いのですぐに分かります。

 \displaystyle
\dfrac{P(袋2 \land 白)}{P(袋1 \land 白) + P(袋2 \land 白) + P(袋3 \land 白)}\\
= \dfrac{1/6}{1/15 + 1/6 + 2/9}\\
\fallingdotseq 0.366

これで求めることができました。

おしまい

最後の式はベイズの定理  P(B_i | A) = \dfrac{P(B_i)P(A|B_i)}{\sum_{j=1}^{k}P(B_j)P(A|B_j)} に当てはめた形になっているわけですが、公式はあんまり覚えてないし、ベン図での定理の説明も分かった気はしているのだけどスッと解けないみたいな状態でした。

確率木に出会ったことで直感的に腑に落ちたように感じることができて、とても良かったです!