-
貝氏定理 (Bayes' Theorem):
參數 θ 在給定資料 D 下的後驗分佈 (posterior distribution) 可以根據貝氏法則求得:
p(θ∣D)=p(y∣X)p(y∣θ,X)p(θ)∝p(y∣θ,X)p(θ)
其中 y 包含了目標值,X 包含了所有特徵。為了求解後驗分佈,我們可以處理未歸一化的對數後驗 (unnormalized log-posterior):
lnp(θ∣D)=lnp(y∣θ,X)+lnp(θ)+const
-
概似函數與先驗 (Likelihood and Prior):
根據模型方程式 y=ΦTθ+ϵ 以及 ϵ∼N(0,Σ),概似函數為 y∣θ,X∼N(ΦTθ,Σ)。因此:
lnp(y∣θ,X)=−21(y−ΦTθ)TΣ−1(y−ΦTθ)+const
先驗為 p(θ)=N(0,Γ),因此:
lnp(θ)=−21θTΓ−1θ+const
-
對數後驗 (Log-Posterior):
將對數概似和對數先驗相加:
lnp(θ∣D)=−21((y−ΦTθ)TΣ−1(y−ΦTθ)+θTΓ−1θ)+const=−21(yTΣ−1y−yTΣ−1ΦTθ−θTΦΣ−1y+θTΦΣ−1ΦTθ+θTΓ−1θ)+const
注意到 yTΣ−1y 對於 θ 是一個常數,且 yTΣ−1ΦTθ=(θTΦΣ−1y)T 是一個純量 (所以兩者完全相等),我們收集關於 θ 的二次項與一次項:
lnp(θ∣D)=−21[θT(Γ−1+ΦΣ−1ΦT)θ−2θTΦΣ−1y]+const
-
配方法 (Completing the Square):
我們希望將它表達為一般常態分佈對數機率密度函數 (log-pdf) 的形式:
lnN(θ∣μ^θ,Σ^θ)=−21(θ−μ^θ)TΣ^θ−1(θ−μ^θ)+const′
展開此形式可得:
−21(θTΣ^θ−1θ−2θTΣ^θ−1μ^θ+μ^θTΣ^θ−1μ^θ)+const′
對比關於 θ 的二次項(θT…θ):
Σ^θ−1=Γ−1+ΦΣ−1ΦT⟹Σ^θ=(Γ−1+ΦΣ−1ΦT)−1
對比關於 θ 的一次項(θT…):
Σ^θ−1μ^θ=ΦΣ−1y⟹μ^θ=Σ^θΦΣ−1y=(Γ−1+ΦΣ−1ΦT)−1ΦΣ−1y
-
結論 (Conclusion):
因此,後驗分佈為一個高斯分佈 p(θ∣D)=N(θ∣μ^θ,Σ^θ),並且具有要求的平均數和共變異數。