-
定義目標函數 (Objective Function)
題目要求我們找出能最小化誤差平方和 (Sum-Squared-Error) 的參數向量 θ,我們將此目標函數表示為 J(θ):
J(θ)=∥y−ΦTθ∥2
-
展開目標函數
我們可以將 L2 範數 (Norm) 的平方表示為內積的形式:
J(θ)=(y−ΦTθ)T(y−ΦTθ)=(yT−θTΦ)(y−ΦTθ)=yTy−yTΦTθ−θTΦy+θTΦΦTθ
-
化簡表達式
請注意,yTΦTθ 是一個純量 (Scalar)(維度為 1×n⋅n×D⋅D×1=1×1)。純量的轉置 (Transpose) 等於其本身,因此:
(yTΦTθ)T=θTΦy
所以,中間的兩項是相等的,目標函數可簡化為:
J(θ)=yTy−2θTΦy+θTΦΦTθ
-
對 θ 計算導數 (Derivative)
為了找到最小值,我們計算 J(θ) 對 θ 的梯度 (Gradient),並將其設為零向量。使用標準的矩陣微積分恆等式:
- ∇θ(θTA)=A
- ∇θ(θTAθ)=(A+AT)θ
對於對稱矩陣 (Symmetric Matrix) A=ΦΦT,其導數 ∇θ(θT(ΦΦT)θ)=2ΦΦTθ。因此:
∂θ∂J(θ)=−2Φy+2ΦΦTθ
-
求解 θ
將導數設為零以求得最佳的 θ:
−2Φy+2ΦΦTθΦΦTθ=0=Φy
假設 ΦΦT 是可逆矩陣 (Invertible Matrix),我們在等式兩側乘上 (ΦΦT)−1:
θ^LS=(ΦΦT)−1Φy