Explain ZH
直覺理解
在 (b) 部分,我們找到了兩個類別之間邊界的方程式:。雖然在數學上是正確的,但它有點抽象。(c) 部分要求我們將這個方程式改寫成一種更容易視覺化的形式:。
可以把它想像成描述一堵牆。你可以用一個複雜的數學公式來描述一堵牆,或者你可以簡單地說:「這堵牆精確地穿過這個特定的點 (),並且它面向這個特定的方向 ()。」
讓我們分解這兩個部分的含義:
1. 方向 ()
向量 是「法向量」。想像你站在邊界上; 是一個從邊界筆直向外指的箭頭,直接指向類別 。它告訴我們邊界是如何傾斜的。它是透過觀察兩個類別中心之間的差異 () 並根據數據的形狀 () 進行調整來計算的。
2. 錨點 ()
這是非常有趣的部分。 是一個精確位於邊界上的特定點。讓我們看看它的公式:
- 中點:第一部分是 。這正好是類別 中心和類別 中心的正中間。如果兩個類別一樣常見,邊界就會正好穿過這個中點。
- 偏移:第二部分涉及 。這是一場基於哪個類別更受歡迎(先驗機率)的「拔河比賽」。
- 如果類別 和類別 出現的機率相等,,所以沒有偏移。錨點停留在中間。
- 如果類別 比類別 常見得多,對數項為正。因為公式中有一個負號,錨點 會被推離類別 並推向類別 。
為什麼它會向較不常見的類別偏移? 想像你是一名醫生,正在診斷一種罕見疾病(類別 )和普通感冒(類別 )。如果一個病人的症狀剛好處於邊界狀態,你更有可能猜測是普通感冒,僅僅是因為它常見得多。透過將決策邊界移近罕見疾病的中心,你實際上是在擴大普通感冒的「領土」。一個數據點必須非常接近罕見疾病的中心,才會被歸類為罕見疾病。先驗機率會移動邊界,為機率較大的類別提供更大的決策區域。