必備知識
- 矩陣微積分 (Matrix Calculus):
- ∂x∂(Ax−b)T(Ax−b)=2AT(Ax−b)(適用於對稱內積或標準推導)。
- ∂x∂xTAx=(A+AT)x。
- 線性代數 (Linear Algebra):
- 秩 (Rank)、反矩陣 (Inverse) 和轉置 (Transpose) 的概念。
逐步解答
我們希望針對 θ 最小化 E(θ)。讓我們展開平方範數:
E(θ)=(y−ΦTθ)T(y−ΦTθ)=(yT−θTΦ)(y−ΦTθ)=yTy−yTΦTθ−θTΦy+θTΦΦTθ
由於 yTΦTθ 是一個純量 (Scalar),它等於其轉置 θTΦy。因此:
E(θ)=yTy−2θTΦy+θTΦΦTθ
現在,我們對 θ 取梯度 (Gradient) 並設為零:
∇θE(θ)=−2Φy+2ΦΦTθ=0
(使用恆等式:當 A 為對稱矩陣時,∇x(xTAx)=2Ax。在此處 A=ΦΦT)
重新整理方程式後可得:
ΦΦTθ=Φy
假設 ΦΦT 可逆,我們得到正規方程 (Normal Equation):
θ=(ΦΦT)−1Φy
"@