Skip to main content

Question ZH

(e) 給定一個新的輸入 xx_*,證明預測分佈 (predictive distribution) f=f(x,θ)f_* = f(x_*, \theta)

p(fx,D)=N(fμ^,σ^2),μ^=ϕ(x)Tμ^θ,σ^2=ϕ(x)TΣ^θϕ(x).\begin{align} p(f_*|x_*, \mathcal{D}) &= \mathcal{N}(f_*|\hat{\mu}_*, \hat{\sigma}^2_*), \tag{3.50} \\ \hat{\mu}_* &= \phi(x_*)^T \hat{\mu}_\theta, \tag{3.51} \\ \hat{\sigma}^2_* &= \phi(x_*)^T \hat{\Sigma}_\theta \phi(x_*). \tag{3.52} \end{align}

(提示:參考問題 1.1)。假設觀察雜訊 σ2\sigma^2 與訓練集相同,證明 yy_* 的預測分佈為

p(yx,D)=p(yx,θ)p(θD)dθ=N(yμ^,σ2+σ^2).(3.53)p(y_*|x_*, \mathcal{D}) = \int p(y_*|x_*, \theta) p(\theta|\mathcal{D}) d\theta = \mathcal{N}(y_*|\hat{\mu}_*, \sigma^2 + \hat{\sigma}^2_*). \tag{3.53}

提示:請注意 p(yx,θ)p(y_*|x_*, \theta) 僅透過 f=ϕ(x)Tθf_* = \phi(x_*)^T \theta 依賴於 θ\theta。因此,我們可以用對 ff_* 的積分來重寫對 θ\theta 的積分,同時將 p(θD)p(\theta|\mathcal{D}) 替換為 p(fD)p(f_*|\mathcal{D})

這是高斯過程迴歸 (Gaussian process regression) 的線性版本。我們將在後續的問題集中探討如何推導非線性(核,kernel)版本。