1. 將先驗識別為 Beta 分佈
首先,讓我們將這些先驗映射到標準 Beta 分佈 Beta(α,β)∝πα−1(1−π)β−1。
2. 計算 MAP 估計
MAP 最大化後驗。
後驗 ∝ 似然 × 先驗。
似然為 πs(1−π)n−s。
情況 1:先驗 p1 (α=2,β=1)
- 後驗 ∝πs(1−π)n−s⋅π1=πs+1(1−π)n−s。
- 這與 Beta(s+2,n−s+1) 成正比。
- 我們最大化 f(π)=πs+1(1−π)n−s。
- 對數後驗:(s+1)lnπ+(n−s)ln(1−π)。
- 導數 = 0:πs+1−1−πn−s=0。
- (s+1)(1−π)=(n−s)π。
- s+1−sπ−π=nπ−sπ。
- s+1=(n+1)π。
- π^MAP,1=n+1s+1。
情況 2:先驗 p0 (α=1,β=2)
- 後驗 ∝πs(1−π)n−s⋅(1−π)1=πs(1−π)n−s+1。
- 這與 Beta(s+1,n−s+2) 成正比。
- 我們最大化 f(π)=πs(1−π)n−s+1。
- 導數 = 0:πs−1−πn−s+1=0。
- s(1−π)=(n−s+1)π。
- s−sπ=nπ−sπ+π。
- s=(n+1)π。
- π^MAP,0=n+1s。
3. 有效估計 (貝葉斯均值)
問題還問“有效估計是什麼……”。這可能模棱兩可(指 MAP 或均值)。問題的第二部分(“虛擬樣本”)適用於兩者,但標準貝葉斯預測使用均值。
為了完整性,讓我們計算均值(後驗期望)。
-
對於 p1 (後驗 Beta(s+2,n−s+1)):
- 均值 = αpost+βpostαpost=(s+2)+(n−s+1)s+2=n+3s+2。
-
對於 p0 (後驗 Beta(s+1,n−s+2)):
- 均值 = (s+1)+(n−s+2)s+1=n+3s+1。
(注意:問題可能要求 MAP 的直觀解釋,因為它特別要求“計算 MAP 估計”。)
4. 直觀解釋(“虛擬”樣本)
我們將先驗的超參數 α,β 解釋為添加到實際數據中的虛擬計數。
Prior∝πα−1(1−π)β−1。
Beta 後驗的 MAP 估計公式:n+(α+β−2)s+(α−1)。
對於 p1 (α=2,β=1):
- 虛擬樣本:我們添加了 1 個樣本,它是一次成功。
- 總虛擬 N′=1。總虛擬 S′=1。
- MAP 估計:n+1s+1。
- 解釋:先驗 2π 就像我們已經觀察到了 一個正面。這將結果偏向 1。
對於 p0 (α=1,β=2):
- 虛擬樣本:我們添加了 1 個樣本,它是一次失敗。
- 總虛擬 N′=1。總虛擬 S′=0。
- MAP 估計:n+1s。
- 解釋:先驗 2(1−π) 就像我們已經觀察到了 一個反面。這將結果偏向 0。