-
寫出 KDE 函數 (Express the KDE):
KDE (核心密度估計) 定義為 p^(x)=n1∑i=1nhd1k(hx−xi)。
-
對 KDE 取變異數 (Apply Variance to the KDE):
我們希望計算 p^(x) 關於隨機樣本 X={x1,…,xn} 的變異數。
varX(p^(x))=varX(nhd1i=1∑nk(hx−xi))
-
利用獨立樣本的變異數性質 (Use Variance Properties for Independent Samples):
由於樣本 x1,…,xn 是獨立同分配 (i.i.d.) 抽取出來的,其和的變異數等於各別變異數的和:var(∑Zi)=∑var(Zi)。
此外,提出常數 c 會給出 var(cZ)=c2var(Z)。
varX(p^(x))=n2h2d1i=1∑nvarxi(k(hx−xi))
因為每個 xi∼p 都具有相同的分佈,連加符號中的所有項都是相等的。令 μ∼p 作為虛擬變數 (dummy variable):
varX(p^(x))=n2h2dnvarμ∼p(k(hx−μ))=nh2d1varμ(k(hx−μ))
-
套用變異數上界限制 (Apply the Variance Upper Bound, Eq 5.3):
使用提示中的 var(Z)≤E[Z2]:
varμ(k(hx−μ))≤Eμ[(k(hx−μ))2]
因此我們得到:
varX(p^(x))≤nh2d1Eμ[(k(hx−μ))2]
-
套用核心函數的最大值限制 (Apply the Kernel Maximum Bound, Eq 5.4):
我們可以將核心函數的平方拆成兩項,並利用核心函數的最大值來限制其中一項。令 maxzk(z) 表示核心函數輸出的最大值 (這等同於題目符號中的 maxx(k(x)))。
(k(hx−μ))2=k(hx−μ)⋅k(hx−μ)≤zmax(k(z))⋅k(hx−μ)
將這個不等式代入期望值中:
Eμ[(k(hx−μ))2]≤Eμ[zmax(k(z))⋅k(hx−μ)]=zmax(k(z))⋅Eμ[k(hx−μ)]
將此結果代回變異數的不等式中:
varX(p^(x))≤nh2d1zmax(k(z))Eμ[k(hx−μ)]
-
與期望密度 E[p^(x)] 建立關聯 (Relate Back to Expected Density):
重新整理右側的式子,使其恢復到在 Part (a) 所推導出來的 E[p^(x)] 形式。我們知道 k~(z)=hd1k(hz),所以:
varX(p^(x))≤nhd1zmax(k(z))⋅Eμ[hd1k(hx−μ)]
我們在 (a) 中已經證明過 Eμ[hd1k(hx−μ)]=EX[p^(x)]。替換這整個區塊:
varX(p^(x))≤nhd1zmax(k(z))EX[p^(x)]
使用題目要求的核心最大值符號 maxx(k(x)),我們就得到了:
varX(p^(x))≤nhd1xmax(k(x))E[p^(x)]