(e) 給定一個新的輸入 x∗,證明預測分佈 (predictive distribution) f∗=f(x∗,θ) 為
p(f∗∣x∗,D)μ^∗σ^∗2=N(f∗∣μ^∗,σ^∗2),=ϕ(x∗)Tμ^θ,=ϕ(x∗)TΣ^θϕ(x∗).(3.50)(3.51)(3.52)
(提示:參考問題 1.1)。假設觀察雜訊 σ2 與訓練集相同,證明 y∗ 的預測分佈為
p(y∗∣x∗,D)=∫p(y∗∣x∗,θ)p(θ∣D)dθ=N(y∗∣μ^∗,σ2+σ^∗2).(3.53)
提示:請注意 p(y∗∣x∗,θ) 僅透過 f∗=ϕ(x∗)Tθ 依賴於 θ。因此,我們可以用對 f∗ 的積分來重寫對 θ 的積分,同時將 p(θ∣D) 替換為 p(f∗∣D)。
這是高斯過程迴歸 (Gaussian process regression) 的線性版本。我們將在後續的問題集中探討如何推導非線性(核,kernel)版本。