-
確認似然函數 (Likelihood function) p(D∣θ):
從模型 y=ΦTθ+ϵ(其中 ϵ∼N(0,Σ))可知,給定 θ 時,y 服從高斯分佈:
p(y∣θ)=N(y∣ΦTθ,Σ)∝exp(−21(y−ΦTθ)TΣ−1(y−ΦTθ))
這裡 D=(X,y),但由於 X 是固定的(判別式設定),我們只關注 p(y∣θ)。
-
確認先驗分佈 (Prior distribution) p(θ):
p(θ)=N(θ∣0,Γ)∝exp(−21θTΓ−1θ)
-
公式化後驗分佈 p(θ∣D):
使用貝葉斯法則,後驗正比於似然與先驗的乘積:
p(θ∣D)∝p(y∣θ)p(θ)
代入指數部分:
∝exp(−21(y−ΦTθ)TΣ−1(y−ΦTθ))exp(−21θTΓ−1θ)
將指數合併為單一算式 E:
E=−21[(y−ΦTθ)TΣ−1(y−ΦTθ)+θTΓ−1θ]
-
展開並針對 θ 進行分組:
展開第一項(注意 (y−ΦTθ)T=yT−θTΦ):
(y−ΦTθ)TΣ−1(y−ΦTθ)=yTΣ−1y−yTΣ−1ΦTθ−θTΦΣ−1y+θTΦΣ−1ΦTθ
由於結果是純量,yTΣ−1ΦTθ=(θTΦΣ−1y)T=θTΦΣ−1y(假設 Σ 是對稱的)。
因此,交叉項(Cross terms)為 −2θTΦΣ−1y。
現在代回 E 並依 θ 的次數分組:
−2E=θTΦΣ−1ΦTθ−2θTΦΣ−1y+yTΣ−1y+θTΓ−1θ
將二次項 (θTAθ) 和一次項 (−2θTb) 分組:
−2E=θT(ΦΣ−1ΦT+Γ−1)θ−2θT(ΦΣ−1y)+const
其中 "const" 包含與 θ 無關的項(例如 yTΣ−1y)。
-
配方 (Complete the Square):
我們將其與高斯分佈 N(θ∣μ^,Σ^) 的指數進行比較:
−21(θ−μ^)TΣ^−1(θ−μ^)=−21[θTΣ^−1θ−2θTΣ^−1μ^+μ^TΣ^−1μ^]
比較二次項 θT(…)θ:
Σ^θ−1=Γ−1+ΦΣ−1ΦT
所以,
Σ^θ=(Γ−1+ΦΣ−1ΦT)−1
比較一次項 −2θT(…):
Σ^θ−1μ^θ=ΦΣ−1y
μ^θ=Σ^θ(ΦΣ−1y)=(Γ−1+ΦΣ−1ΦT)−1ΦΣ−1y
-
結論:
後驗分佈確實是高斯分佈,具有推導出的平均值和共變異數:
p(θ∣D)=N(θ∣μ^θ,Σ^θ)