Skip to main content

Explain ZH

直觀解釋

我們的目標是找出估計分佈 p^(x)\hat{p}(x) 的「質心」(平均數)。

回想一下核密度估計 (KDE) 的建構方式:它在每一個資料點 xix_i 上放置一個小的「隆起」(核函數 k~\tilde{k})。每個隆起的總機率質量為 1/n1/n

  1. 個別隆起:每個個別的核函數 k~(xxi)\tilde{k}(x - x_i) 都以 xix_i 為中心。根據假設(零平均數核函數),這個個別隆起的平均數正好是 xix_i
  2. 混合:整個分佈 p^(x)\hat{p}(x) 只是這 nn 個隆起的平均(混合)。
  3. 結果:混合分佈的平均數,就是個別分佈平均數的加權平均。由於每個隆起的權重都是 1/n1/n,且平均數為 xix_i,因此總平均數就是 1nxi\frac{1}{n} \sum x_i,也就是樣本平均數。

簡單來說:KDE 完美地在原始資料點周圍保持平衡。它不會移動資料的中心位置。