問題 3.11 具有高斯先驗的貝葉斯迴歸
在上一個習題集中,我們展示了透過最小二乘法進行線性迴歸的各種形式,實際上只是下列模型下最大似然 (ML) 估計的特例:
y=ΦTθ+ϵ(3.42)
其中 θ=[θ1,…,θD]T 是參數向量,y=[y1,…,yn]T 是輸出向量,{x1,…,xn} 是對應的輸入集合,ϕ(xi) 是特徵轉換,且
Φ=[ϕ(x1),…,ϕ(xn)](3.43)
而 ϵ=[ϵ1,…,ϵn]T 是一個常態隨機過程 ϵ∼N(0,Σ),具有某個共變異數矩陣 Σ。
考慮這個模型的貝葉斯擴展是很自然的。為此,我們只需擴展模型,考慮一個高斯先驗:
p(θ)=N(θ∣0,Γ),
其中 Γ 是共變異數矩陣。我們首先推導一個一般結果(針對一般的共變異數矩陣 Σ 和 Γ),然後展示它如何與其他方法相關聯。
(a) 給定訓練集 D={(x1,y1),…,(xn,yn)},證明後驗分佈為:
p(θ∣D)=N(θ∣μ^θ,Σ^θ),(3.44)
μ^θ=(Γ−1+ΦΣ−1ΦT)−1ΦΣ−1y,(3.45)
Σ^θ=(Γ−1+ΦΣ−1ΦT)−1,(3.46)
其中 μ^θ 是後驗平均值,Σ^θ 是後驗共變異數。不要假設共變異數矩陣 Σ 和 Γ 的任何特定形式。提示:配方 (Completing the square) (問題 1.10)。