Skip to main content

問題 3.8(e) 解釋

為什麼是 2π2\pi2(1π)2(1-\pi)

這些是線性函數。

  • 2π2\pi 是一條從 0022 的直線。三角形下的面積是 0.5××=0.5×1×2=10.5 \times \text{底} \times \text{高} = 0.5 \times 1 \times 2 = 1。所以它是一個有效的 PDF。它將最大的權重放在 π=1\pi=1 上。
  • 2(1π)2(1-\pi) 是一條從 2200 的直線。面積也是 1。它將最大的權重放在 π=0\pi=0 上。

映射到偽計數 (Pseudocounts)

關鍵的見解是將多項式寫成 πα1(1π)β1\pi^{\alpha-1}(1-\pi)^{\beta-1} 的形式。

  • 對於 2π2\piπ\pi 的指數是 1。因為 α1=1\alpha-1=1,所以 α=2\alpha=2(1π)(1-\pi) 的指數是 0。因為 β1=0\beta-1=0,所以 β=1\beta=1
  • 通常,我們說 α\alpha 計算成功次數,β\beta 計算失敗次數。
  • 然而,對於 MAP 估計,“中性”點不是 α=0,β=0\alpha=0, \beta=0(這是不正確的)或 α=1,β=1\alpha=1, \beta=1(均勻)。
  • 等等,讓我們再看看 MAP 公式: π^MAP=s+α1n+α+β2\hat{\pi}_{MAP} = \frac{s + \alpha - 1}{n + \alpha + \beta - 2}
    • 如果 α=2,β=1\alpha=2, \beta=1 (先驗 p1p_1): 分子=s+1\text{分子} = s + 1 分母=n+2+12=n+1\text{分母} = n + 2 + 1 - 2 = n+1 結果:s+1n+1\frac{s+1}{n+1}。 這看起來像我們向分子添加了 1 次成功,向分母添加了 1 次試驗。 所以:1 次虛擬成功,0 次虛擬失敗

    • 如果 α=1,β=2\alpha=1, \beta=2 (先驗 p0p_0): 分子=s+0\text{分子} = s + 0 分母=n+1+22=n+1\text{分母} = n + 1 + 2 - 2 = n+1 結果:sn+1\frac{s}{n+1}。 這看起來像我們向分子添加了 0 次成功,向分母添加了 1 次試驗。 所以:0 次虛擬成功,1 次虛擬失敗

偏差總結

  • p1p_1 編碼了一種信念:“我已經看到了一次成功”。
  • p0p_0 編碼了一種信念:“我已經看到了一次失敗”。
  • 均勻(來自前面的部分)編碼了“我什麼都沒看到?還是各看到 1 個?”
    • 均勻分佈的 MAP (α=1,β=1\alpha=1, \beta=1):sn\frac{s}{n}。(0 個添加樣本)。
    • 所以,相對於均勻 MAP,p1p_1 增加了一次成功,p0p_0 增加了一次失敗。