Answer ZH

先備知識

損失函數 (Loss Functions)
明可夫斯基損失 (Minkowski Loss)
函數繪圖 (Function Plotting)

逐步推導

理解函數： 我們要繪製 $L_q(e) = |e|^q$ ，其中 $e = g(x) - y$ 是誤差。我們需要繪製 $q \in \{0.2, 1, 2, 10\}$ 以及當 $q \rightarrow 0$ 時的極限情況。
分析不同 $q$ 值的行為：
- $q = 2$ (平方損失)： $L_2(e) = e^2$ 。這是一個標準的拋物線。它對大誤差 ( $|e| > 1$ ) 施加重罰，而在接近零的地方非常平緩，這意味著對小誤差的懲罰非常小。
- $q = 1$ (絕對損失)： $L_1(e) = |e|$ 。這是一個 V 形曲線。懲罰隨誤差呈線性增長。
- $q = 10$ ： $L_{10}(e) = |e|^{10}$ 。這條曲線在 $|e| < 1$ 時極度平坦，而在 $|e| > 1$ 時增長得令人難以置信地快。它幾乎像一道屏障，強烈阻止任何大於 1 的誤差。
- $q = 0.2$ ： $L_{0.2}(e) = |e|^{0.2}$ 。這條曲線在接近零時急劇上升，然後趨於平緩。與平方損失相比，它對小誤差的懲罰相對較大，但對大誤差的懲罰增長非常緩慢。
- $q \rightarrow 0$ (相當於迴歸的 0-1 損失)： 當 $q \rightarrow 0$ 時，對於任何 $e \neq 0$ ， $|e|^q \rightarrow 1$ 。對於 $e = 0$ ， $0^q = 0$ 。因此， $\lim_{q \to 0} L_q(e)$ 趨近於一個指示函數 (indicator function)：如果 $e=0$ 則為 $0$ ，如果 $e \neq 0$ 則為 $1$ 。
繪圖（概念描述）：
- x 軸是誤差 $e = g(x) - y$ 。
- y 軸是損失 $L_q$ 。
- 所有曲線都通過 $(0,0)$ 、 $(1,1)$ 和 $(-1,1)$ 。
- 對於 $|e| < 1$ ： $q$ 值較小的曲線較高（例如， $|e|^{0.2} > |e|^1 > |e|^2$ ）。
- 對於 $|e| > 1$ ： $q$ 值較大的曲線較高（例如， $|e|^{10} > |e|^2 > |e|^1$ ）。
關於影響的評論：
- 大的 $q$ ( $q > 1$ )： 嚴重懲罰離群值 (outliers)（大誤差）。模型將專注於避免犯大錯，即使這意味著會犯許多小錯。它對雜訊很敏感。
- $q = 1$ ： 與 $q=2$ 相比，對離群值具有穩健性 (robust)。懲罰與誤差成正比。
- 小的 $q$ ( $0 < q < 1$ )： 對離群值非常穩健，因為對大誤差的懲罰增長非常緩慢。然而，它對小誤差的懲罰相對較重。
- $q \rightarrow 0$ ： 只在乎完全匹配。任何誤差，無論多小或多大，都會受到同等的懲罰（損失為 1）。

先備知識​

逐步推導​

先備知識

逐步推導