-
定義核心密度估計量 (Define the Kernel Density Estimator):
標準的核心密度估計量 (KDE) 定義如下:
p^(x)=n1i=1∑nhd1k(hx−xi)
在此我們引入重新縮放過的核心函數 k~(z)=hd1k(hz),這可以將 KDE 的表達式簡化為:
p^(x)=n1i=1∑nk~(x−xi)
-
取期望值 (Take the Expectation):
我們希望能找出估計量 p^(x) 在隨機樣本數據集 X 上的期望值。我們套用期望值運算子 EX:
EX[p^(x)]=EX[n1i=1∑nk~(x−xi)]
-
套用期望值的線性性質 (Apply Linearity of Expectation):
因為和的期望值等於期望值的和,我們可以將 E 移到連加符號裡面:
EX[p^(x)]=n1i=1∑nExi∼p[k~(x−xi)]
由於所有樣本 x1,…,xn 都是從真實密度 p(x) 中獨立同分配 (independent and identically distributed, i.i.d.) 抽取出來的,因此每一個期望值 E[k~(x−xi)] 都是相同的。讓我們使用虛擬變數 (dummy variable) μ 來代表從 p 中抽取的任何樣本:
Eμ∼p[k~(x−μ)]⇒EX[p^(x)]=nnEμ∼p[k~(x−μ)]=Eμ∼p[k~(x−μ)]
-
將期望值表示為積分 (Express Expectation as an Integral):
根據連續隨機變數 μ∼p(μ) 期望值的定義,函數 f(μ) 的期望值為 ∫f(μ)p(μ)dμ。將我們的函數 f(μ)=k~(x−μ) 帶入:
∫f(μ)p(μ)dμ=∫k~(x−μ)p(μ)dμ=∫p(μ)k~(x−μ)dμ
因此,EX[p^(x)]=∫p(μ)k~(x−μ)dμ。
-
識別出卷積運算 (Recognize the Convolution):
兩個函數的乘積,其中一個函數先反轉再平移的積分 ∫f(μ)g(x−μ)dμ,正好就是卷積 (convolution) (f∗g)(x) 的定義。因此:
∫p(μ)k~(x−μ)dμ=(p∗k~)(x)=p(x)∗k~(x)
這就證明了方程式 (5.1)。
-
關於偏差的結論 (Conclusion on Bias):
估計量的偏差定義為 Bias(p^(x))=E[p^(x)]−p(x)。
因此,KDE 的偏差為 p(x)∗k~(x)−p(x)。這告訴我們,KDE 通常是一個 有偏 (biased) 估計量。它的期望值並不會剛好等於真實密度 p(x),而是真實密度 p(x) 透過核心函數 k~ 進行平滑化 (卷積) 後的版本。