Answer ZH
預備知識
- MAP 估計 (Maximum A Posteriori): 最大後驗機率估計尋找後驗分佈的眾數(峰值)。
- 高斯分佈的眾數: 對於高斯分佈 ,眾數等於平均值 。
- 最小二乘法解 (Least Squares Solution): (使用本題符號)。
- 加權最小二乘法 (Weighted Least Squares): 。
逐步解答
-
確定 : 由於後驗 是平均值為 的高斯分佈,機率密度函數的最大值正好發生在平均值處。因此:
-
與加權最小二乘法 (WLS) 的比較: WLS 估計源於考慮觀測共變異數 時的最大似然 (ML) 估計:
差異: MAP 估計在逆矩陣內部的「散佈矩陣 (scatter matrix)」 上增加了一個額外的項 。
-
與普通最小二乘法 (OLS) 的比較: OLS 假設 (獨立同分佈雜訊,常數變異數)且沒有先驗。
差異: MAP 包含雜訊的共變異數結構 (處理異方差性或相關雜訊)以及先驗精確度 。
-
新項的作用: 表示 先驗精確度 (prior precision)(逆共變異數)。
- 它作為正則化項 (regularizer)。
- 它將估計值「拉」向先驗平均值(在本題中為 0)。
- 在數學上,它有效地向被求逆的矩陣的對角線(或特徵值)添加正值。
-
優勢: 是的,將 設定為非零值(即使用先驗)有顯著優勢:
- 正則化 (Regularization): 它防止過度擬合 (Overfitting)。當數據稀少或有雜訊時,先驗限制參數不會爆炸。
- 數值穩定性 (Numerical Stability): 如果 是奇異的或病態的 (ill-conditioned)(例如,數據點少於特徵數,或特徵共線),則 ML/LS 的逆矩陣不存在或不穩定。加上 (正定矩陣)使得矩陣可逆( 總是存在)。