Skip to main content

Explain ZH

直覺理解

想像一張地圖上有兩個城市(類別 ii 和類別 jj)。你想在它們之間畫一條邊界線,這樣如果你在線的一側,你就離城市 ii 更近;在另一側,你就離城市 jj 更近。

決策邊界正是這條邊界線。在這個地方,屬於類別 ii 的「分數」完全等於屬於類別 jj 的「分數」。你處於完全無法決定的狀態。

因為我們在 (a) 部分得出的評分系統只是一個簡單的線性方程式(就像一個平面的方程式),當我們將這兩個分數設為相等時,結果是另一個線性方程式。在幾何學中,線性方程式描述了一個稱為超平面 (hyperplane) 的平坦表面(在 2D 中是一條線,在 3D 中是一個平面,依此類推)。

讓我們分解這個邊界方程式 wTx+b=0w^T x + b = 0 的兩個部分:

  1. 方向 (ww):向量 ww 決定了邊界的傾斜度或方向。它的計算方式為 Σ1(μiμj)\Sigma^{-1}(\mu_i - \mu_j)

    • (μiμj)(\mu_i - \mu_j) 是一個直接從類別 jj 的中心指向類別 ii 的中心的箭頭。
    • 乘以 Σ1\Sigma^{-1} 會根據數據的分佈方式來調整這個箭頭。如果數據在某個方向上被拉伸,邊界就會傾斜以適應這種拉伸。
  2. 位置 (bb):純量 bb 決定了邊界沿著該方向放置的位置。它包含兩個組成部分:

    • 中點12(μi+μj)TΣ1(μiμj)-\frac{1}{2}(\mu_i + \mu_j)^T \Sigma^{-1} (\mu_i - \mu_j) 這一項基本上將邊界精確地放置在兩個類別中心的正中間(並根據數據的形狀進行了調整)。
    • 受歡迎程度偏移logπiπj\log \frac{\pi_i}{\pi_j} 這一項會根據哪個類別更常見來移動邊界。如果類別 ii 比類別 jj 常見得多(πi>πj\pi_i > \pi_j),這個項就是正的,這會將邊界推類別 ii,使其更靠近類別 jj。這很合理:如果類別 ii 整體上更有可能出現,你會想為它佔領更多的領土!