Skip to main content

Answer ZH

先備知識

  • 損失函數 (Loss Functions)
  • 明可夫斯基損失 (Minkowski Loss)
  • 函數繪圖 (Function Plotting)

逐步推導

  1. 理解函數: 我們要繪製 Lq(e)=eqL_q(e) = |e|^q,其中 e=g(x)ye = g(x) - y 是誤差。 我們需要繪製 q{0.2,1,2,10}q \in \{0.2, 1, 2, 10\} 以及當 q0q \rightarrow 0 時的極限情況。

  2. 分析不同 qq 值的行為:

    • q=2q = 2 (平方損失): L2(e)=e2L_2(e) = e^2。這是一個標準的拋物線。它對大誤差 (e>1|e| > 1) 施加重罰,而在接近零的地方非常平緩,這意味著對小誤差的懲罰非常小。
    • q=1q = 1 (絕對損失): L1(e)=eL_1(e) = |e|。這是一個 V 形曲線。懲罰隨誤差呈線性增長。
    • q=10q = 10 L10(e)=e10L_{10}(e) = |e|^{10}。這條曲線在 e<1|e| < 1 時極度平坦,而在 e>1|e| > 1 時增長得令人難以置信地快。它幾乎像一道屏障,強烈阻止任何大於 1 的誤差。
    • q=0.2q = 0.2 L0.2(e)=e0.2L_{0.2}(e) = |e|^{0.2}。這條曲線在接近零時急劇上升,然後趨於平緩。與平方損失相比,它對小誤差的懲罰相對較大,但對大誤差的懲罰增長非常緩慢。
    • q0q \rightarrow 0 (相當於迴歸的 0-1 損失):q0q \rightarrow 0 時,對於任何 e0e \neq 0eq1|e|^q \rightarrow 1。對於 e=0e = 00q=00^q = 0。因此,limq0Lq(e)\lim_{q \to 0} L_q(e) 趨近於一個指示函數 (indicator function):如果 e=0e=0 則為 00,如果 e0e \neq 0 則為 11
  3. 繪圖(概念描述):

    • x 軸是誤差 e=g(x)ye = g(x) - y
    • y 軸是損失 LqL_q
    • 所有曲線都通過 (0,0)(0,0)(1,1)(1,1)(1,1)(-1,1)
    • 對於 e<1|e| < 1qq 值較小的曲線較高(例如, e0.2>e1>e2|e|^{0.2} > |e|^1 > |e|^2)。
    • 對於 e>1|e| > 1qq 值較大的曲線較高(例如, e10>e2>e1|e|^{10} > |e|^2 > |e|^1)。
  4. 關於影響的評論:

    • 大的 qq (q>1q > 1): 嚴重懲罰離群值 (outliers)(大誤差)。模型將專注於避免犯大錯,即使這意味著會犯許多小錯。它對雜訊很敏感。
    • q=1q = 1q=2q=2 相比,對離群值具有穩健性 (robust)。懲罰與誤差成正比。
    • 小的 qq (0<q<10 < q < 1): 對離群值非常穩健,因為對大誤差的懲罰增長非常緩慢。然而,它對小誤差的懲罰相對較重。
    • q0q \rightarrow 0 只在乎完全匹配。任何誤差,無論多小或多大,都會受到同等的懲罰(損失為 1)。