Skip to main content

Explain ZH

直覺理解

在 (b) 部分,我們找到了兩個類別之間邊界的方程式:wTx+b=0w^T x + b = 0。雖然在數學上是正確的,但它有點抽象。(c) 部分要求我們將這個方程式改寫成一種更容易視覺化的形式:wT(xx0)=0w^T(x - x_0) = 0

可以把它想像成描述一堵牆。你可以用一個複雜的數學公式來描述一堵牆,或者你可以簡單地說:「這堵牆精確地穿過這個特定的點 (x0x_0),並且它面向這個特定的方向 (ww)。」

讓我們分解這兩個部分的含義:

1. 方向 (ww)

向量 ww 是「法向量」。想像你站在邊界上;ww 是一個從邊界筆直向外指的箭頭,直接指向類別 ii。它告訴我們邊界是如何傾斜的。它是透過觀察兩個類別中心之間的差異 (μiμj\mu_i - \mu_j) 並根據數據的形狀 (Σ1\Sigma^{-1}) 進行調整來計算的。

2. 錨點 (x0x_0)

這是非常有趣的部分。x0x_0 是一個精確位於邊界上的特定點。讓我們看看它的公式: x0=中點基於受歡迎程度的偏移x_0 = \text{中點} - \text{基於受歡迎程度的偏移}

  • 中點:第一部分是 μi+μj2\frac{\mu_i + \mu_j}{2}。這正好是類別 ii 中心和類別 jj 中心的正中間。如果兩個類別一樣常見,邊界就會正好穿過這個中點。
  • 偏移:第二部分涉及 logπiπj\log \frac{\pi_i}{\pi_j}。這是一場基於哪個類別更受歡迎(先驗機率)的「拔河比賽」。
    • 如果類別 ii 和類別 jj 出現的機率相等,log(1)=0\log(1) = 0,所以沒有偏移。錨點停留在中間。
    • 如果類別 ii 比類別 jj 常見得多,對數項為正。因為公式中有一個負號,錨點 x0x_0 會被推離類別 ii推向類別 jj

為什麼它會向較不常見的類別偏移? 想像你是一名醫生,正在診斷一種罕見疾病(類別 jj)和普通感冒(類別 ii)。如果一個病人的症狀剛好處於邊界狀態,你更有可能猜測是普通感冒,僅僅是因為它常見得多。透過將決策邊界移近罕見疾病的中心,你實際上是在擴大普通感冒的「領土」。一個數據點必須非常接近罕見疾病的中心,才會被歸類為罕見疾病。先驗機率會移動邊界,為機率較大的類別提供更大的決策區域。