-
寫出估計器的期望值:
由於 xi 是來自 p(x) 的獨立同分佈 (i.i.d.) 樣本,且期望值是線性的:
EX[p^(x)]=E[n1i=1∑nk~(x−xi)]=n1i=1∑nE[k~(x−xi)]
-
利用同分佈簡化:
由於所有 xi 服從相同的分佈 p(x),因此 E[k~(x−xi)] 對所有 i 都是相同的。
EX[p^(x)]=E[k~(x−x1)]
-
計算期望值:
根據連續隨機變量 x1∼p(μ) 的期望值定義:
E[k~(x−x1)]=∫k~(x−μ)p(μ)dμ
-
關聯到卷積:
積分 ∫p(μ)k~(x−μ)dμ 正是 p 和 k~ 之間卷積的定義,記為 p(x)∗k~(x)。
EX[p^(x)]=p(x)∗k~(x)
-
偏差的解釋:
KDE 的期望值不是真實密度 p(x),而是真實密度與核函數的卷積(平滑化)。
Bias[p^(x)]=E[p^(x)]−p(x)=(p∗k~)(x)−p(x)
這意味著 KDE 是一個 有偏 (biased) 估計器。卷積運算會「塗抹」或平滑 p(x) 的概率質量,通常會降低峰值並填補低谷。偏差取決於帶寬 h;當 h→0 時,核函數趨近於狄拉克 δ 函數,偏差趨近於 0(漸近無偏)。