-
分析限制條件:
令 θi=θi+−θi− 且受限於 θi+≥0 與 θi−≥0。我們想要證明在最佳化目標下,最小化 λ∣θi+−θi−∣ 等價於最小化 λ(θi++θi−)。
-
絕對值表示:
注意根據定義:
∣θi∣=∣θ+_i−θ−_i∣
我們知道對於任何正數,∣θ+_i−θ−_i∣≤θ+_i+θ−_i,因為等號右邊是兩個正數之和,左邊是它們的絕對差。若且唯若 θi+=0 或 θi−=0(或兩者皆為 0)時,等號才成立。
-
最佳解時的行為 (Behavior at the Optimum):
假設在最佳解時,存在一個索引 i 使得 θi+>0 且 θi−>0 同時成立。令 c=min(θi+,θi−)>0。
我們可以定義一組新的變數:
(θi+)new=θi+−c
(θ−_i)new=θ−_i−c
請注意兩件事:
- θi 的值保持不變:
(θi+)new−(θi−)new=(θ+_i−c)−(θ−_i−c)=θ+_i−θ−_i=θi
因此,平方損失項 21∥y−ΦT(θ+−θ−)∥2 完全沒有改變。
- 然而,(3.63) 中的正則化總和嚴格下降了:
(θi+)new+(θi−)new=θ+_i−c+θ−_i−c=(θ+_i+θ−_i)−2c<(θ+_i+θ−_i)
因為我們的目標是 最小化 成本函數,任何使得 θi+>0 和 θi−>0 同時成立的解都不可能是真正的最小值。最佳化器總是會傾向於從兩者中都減去 c,直到其中至少一個達到零,從而嚴格降低目標值。
-
結論:
因此,在最佳解處,對於每一個 i,要麼 θi+=0,要麼 θi−=0。
當其中至少有一個為零時,絕對值變成:
∣θ+_i−θ−_i∣=θ+_i+θ−_i
由於最佳解處具有這個屬性,我們可以在 (3.62) 中安全地將不可微的 ∣θi+−θi−∣ 取代為 (3.63) 中簡單的線性加總 (θi++θi−)。 這就在不改變最佳解的情況下,將問題轉換成一個簡單得多的形式。