在這個問題中,我們將探討線性迴歸 (Linear Regression) 議題,以及最大概似估計 (Maximum Likelihood) 與最小平方法 (Least Squares) 解之間的關聯。考慮 x∈R 的多項式函數:
f(x,θ)=k=0∑Kxkθk=ϕ(x)Tθ(2.7)
其中我們定義特徵轉換 ϕ(x) 和參數向量 θ(兩者的維度均為 D=K+1)為:
ϕ(x)=[1,x,x2,⋯,xK]T∈RD,θ=[θ0,⋯,θK]T∈RD.(2.8)
給定輸入 x,我們觀察到的不是實際函數值 f(x,θ),而是一個帶有雜訊的版本 y:
y=f(x,θ)+ϵ,(2.9)
其中 ϵ 是一個平均值為零且變異數為 σ2 的高斯隨機變數。我們的目標是在給定獨立同分佈 (i.i.d) 樣本 D={(x1,y1),…,(xn,yn)} 的情況下,獲得該函數的最佳估計。
(a) 將此問題公式化為最小平方法 (Least Squares) 問題,即定義:
y=y1⋮yn,Φ=[ϕ(x1),⋯,ϕ(xn)]=1x11⋮x1K⋯⋯1xn1⋮xnK(2.10)
並找出能最小化平方誤差和 (Sum-Squared-Error) 的 θ 值:
i=1∑n(yi−ϕ(xi)Tθ)2=∥y−ΦTθ∥2.(2.11)