Skip to main content

問題 3.8(b) 答案

預備知識

  1. 貝葉斯定理 (Bayes' Rule)p(πD)=p(Dπ)p(π)p(D)p(\pi|\mathcal{D}) = \frac{p(\mathcal{D}|\pi)p(\pi)}{p(\mathcal{D})} 其中:

    • p(πD)p(\pi|\mathcal{D})後驗 (posterior) 分佈。
    • p(Dπ)p(\mathcal{D}|\pi)似然 (likelihood)
    • p(π)p(\pi)先驗 (prior)
    • p(D)=p(Dπ)p(π)dπp(\mathcal{D}) = \int p(\mathcal{D}|\pi)p(\pi) d\pi證據 (evidence) (歸一化常數)。
  2. 均勻先驗 (Uniform Prior)π[0,1]\pi \in [0, 1] 上的均勻先驗意味著 p(π)=1p(\pi) = 1,對於 0π10 \le \pi \le 1

  3. Beta 函數恆等式:如公式 (3.32) 所示: 01πm(1π)ndπ=m!n!(m+n+1)!\int_0^1 \pi^m (1-\pi)^n d\pi = \frac{m!n!}{(m+n+1)!}

分步證明

  1. 構造後驗分佈: 使用貝葉斯定理:

    p(πD)=p(Dπ)p(π)01p(Dπ)p(π)dπp(\pi|\mathcal{D}) = \frac{p(\mathcal{D}|\pi)p(\pi)}{\int_0^1 p(\mathcal{D}|\pi')p(\pi') d\pi'}
  2. 代入似然和先驗: 從 (a) 部分可知,似然 p(Dπ)=πs(1π)nsp(\mathcal{D}|\pi) = \pi^s (1-\pi)^{n-s}。 給定均勻先驗,p(π)=1p(\pi) = 1。 分子是:

    p(Dπ)p(π)=πs(1π)ns1=πs(1π)nsp(\mathcal{D}|\pi)p(\pi) = \pi^s (1-\pi)^{n-s} \cdot 1 = \pi^s (1-\pi)^{n-s}
  3. 計算證據 (分母): 設 Z=p(D)=01πs(1π)nsdπZ = p(\mathcal{D}) = \int_0^1 \pi^s (1-\pi)^{n-s} d\pi。 我們使用恆等式 (3.32),其中 m=sm = s,並且 (1π)(1-\pi) 的指數為 nsn-s。注意恆等式中的 "nn" 代表指數,所以我們用我們的 "nsn-s" 替換恆等式中的 "nn"。 使用恆等式:01πm(1π)kdπ=m!k!(m+k+1)!\int_0^1 \pi^m (1-\pi)^k d\pi = \frac{m!k!}{(m+k+1)!}。 這裡,m=sm=sk=nsk=n-s

    Z=01πs(1π)nsdπ=s!(ns)!(s+(ns)+1)!=s!(ns)!(n+1)!Z = \int_0^1 \pi^s (1-\pi)^{n-s} d\pi = \frac{s!(n-s)!}{(s + (n-s) + 1)!} = \frac{s!(n-s)!}{(n+1)!}
  4. 計算後驗: 將分子除以分母 ZZ

    p(πD)=πs(1π)nsZ=πs(1π)nss!(ns)!(n+1)!p(\pi|\mathcal{D}) = \frac{\pi^s (1-\pi)^{n-s}}{Z} = \frac{\pi^s (1-\pi)^{n-s}}{\frac{s!(n-s)!}{(n+1)!}} p(πD)=(n+1)!s!(ns)!πs(1π)nsp(\pi|\mathcal{D}) = \frac{(n+1)!}{s!(n-s)!} \pi^s (1-\pi)^{n-s}

    這與公式 (3.33) 相符。

n=1n=1 時的繪圖

對於 n=1n=1ss 的可能值是 s=0s=0s=1s=1

  1. 情況 s=1s=1 (一次成功)

    p(πD)=(1+1)!1!(11)!π1(1π)11=211π(1)=2πp(\pi|\mathcal{D}) = \frac{(1+1)!}{1!(1-1)!} \pi^1 (1-\pi)^{1-1} = \frac{2}{1 \cdot 1} \pi (1) = 2\pi

    這是一個從 0 增加到 2 的線性函數。

  2. 情況 s=0s=0 (一次失敗)

    p(πD)=(1+1)!0!(10)!π0(1π)10=211(1)(1π)=2(1π)p(\pi|\mathcal{D}) = \frac{(1+1)!}{0!(1-0)!} \pi^0 (1-\pi)^{1-0} = \frac{2}{1 \cdot 1} (1) (1-\pi) = 2(1-\pi)

    這是一個從 2 減少到 0 的線性函數。

(自檢:2π2\pi 在 0 到 1 上的積分是 [π2]01=1[\pi^2]_0^1 = 12(1π)2(1-\pi) 的積分是 [(1π)2]01=[01]=1-[(1-\pi)^2]_0^1 = -[0 - 1] = 1。兩者都是有效的 PDF。)

繪圖描述

  • 對於 s=1s=1:一條從 (0,0)(0,0) 開始並到達 (1,2)(1,2) 的直線。它傾向於更高的 π\pi 值。
  • 對於 s=0s=0:一條從 (0,2)(0,2) 開始並到達 (1,0)(1,0) 的直線。它傾向於更低的 π\pi 值。