Skip to main content

解答 (b)

預備知識 (Prerequisites)

  • 和的變異數 (Variance of a Sum - 獨立變數)
  • 核心函數的性質 (Kernel Function Properties)

逐步推導 (Step-by-Step Derivation)

  1. 寫出 KDE 函數 (Express the KDE): KDE (核心密度估計) 定義為 p^(x)=1ni=1n1hdk(xxih)\hat{p}(x) = \frac{1}{n}\sum_{i=1}^n \frac{1}{h^d} k\left(\frac{x - x_i}{h}\right)

  2. 對 KDE 取變異數 (Apply Variance to the KDE): 我們希望計算 p^(x)\hat{p}(x) 關於隨機樣本 X={x1,,xn}X = \{x_1, \dots, x_n\} 的變異數。

    varX(p^(x))=varX(1nhdi=1nk(xxih))\mathrm{var}_X(\hat{p}(x)) = \mathrm{var}_X \left( \frac{1}{n h^d} \sum_{i=1}^n k\left(\frac{x - x_i}{h}\right) \right)
  3. 利用獨立樣本的變異數性質 (Use Variance Properties for Independent Samples): 由於樣本 x1,,xnx_1, \dots, x_n 是獨立同分配 (i.i.d.) 抽取出來的,其和的變異數等於各別變異數的和:var(Zi)=var(Zi)\mathrm{var}(\sum Z_i) = \sum \mathrm{var}(Z_i)。 此外,提出常數 cc 會給出 var(cZ)=c2var(Z)\mathrm{var}(c Z) = c^2 \mathrm{var}(Z)

    varX(p^(x))=1n2h2di=1nvarxi(k(xxih))\mathrm{var}_X(\hat{p}(x)) = \frac{1}{n^2 h^{2d}} \sum_{i=1}^n \mathrm{var}_{x_i} \left( k\left(\frac{x - x_i}{h}\right) \right)

    因為每個 xipx_i \sim p 都具有相同的分佈,連加符號中的所有項都是相等的。令 μp\mu \sim p 作為虛擬變數 (dummy variable):

    varX(p^(x))=nn2h2dvarμp(k(xμh))=1nh2dvarμ(k(xμh))\mathrm{var}_X(\hat{p}(x)) = \frac{n}{n^2 h^{2d}} \mathrm{var}_{\mu \sim p} \left( k\left(\frac{x - \mu}{h}\right) \right) = \frac{1}{n h^{2d}} \mathrm{var}_{\mu} \left( k\left(\frac{x - \mu}{h}\right) \right)
  4. 套用變異數上界限制 (Apply the Variance Upper Bound, Eq 5.3): 使用提示中的 var(Z)E[Z2]\mathrm{var}(Z) \le \mathbb{E}[Z^2]

    varμ(k(xμh))Eμ[(k(xμh))2]\mathrm{var}_{\mu} \left( k\left(\frac{x - \mu}{h}\right) \right) \le \mathbb{E}_{\mu} \left[ \left( k\left(\frac{x - \mu}{h}\right) \right)^2 \right]

    因此我們得到:

    varX(p^(x))1nh2dEμ[(k(xμh))2]\mathrm{var}_X(\hat{p}(x)) \le \frac{1}{n h^{2d}} \mathbb{E}_{\mu} \left[ \left( k\left(\frac{x - \mu}{h}\right) \right)^2 \right]
  5. 套用核心函數的最大值限制 (Apply the Kernel Maximum Bound, Eq 5.4): 我們可以將核心函數的平方拆成兩項,並利用核心函數的最大值來限制其中一項。令 maxzk(z)\max_z k(z) 表示核心函數輸出的最大值 (這等同於題目符號中的 maxx(k(x))\max_x(k(x)))。

    (k(xμh))2=k(xμh)k(xμh)maxz(k(z))k(xμh)\left( k\left(\frac{x - \mu}{h}\right) \right)^2 = k\left(\frac{x - \mu}{h}\right) \cdot k\left(\frac{x - \mu}{h}\right) \le \max_z(k(z)) \cdot k\left(\frac{x - \mu}{h}\right)

    將這個不等式代入期望值中:

    Eμ[(k(xμh))2]Eμ[maxz(k(z))k(xμh)]=maxz(k(z))Eμ[k(xμh)]\mathbb{E}_{\mu} \left[\left( k\left(\frac{x - \mu}{h}\right) \right)^2\right] \le \mathbb{E}_{\mu} \left[ \max_z(k(z)) \cdot k\left(\frac{x - \mu}{h}\right) \right] = \max_z(k(z)) \cdot \mathbb{E}_{\mu} \left[ k\left(\frac{x - \mu}{h}\right) \right]

    將此結果代回變異數的不等式中:

    varX(p^(x))1nh2dmaxz(k(z))Eμ[k(xμh)]\mathrm{var}_X(\hat{p}(x)) \le \frac{1}{n h^{2d}} \max_z(k(z)) \mathbb{E}_{\mu} \left[ k\left(\frac{x - \mu}{h}\right) \right]
  6. 與期望密度 E[p^(x)]\mathbb{E}[\hat{p}(x)] 建立關聯 (Relate Back to Expected Density): 重新整理右側的式子,使其恢復到在 Part (a) 所推導出來的 E[p^(x)]\mathbb{E}[\hat{p}(x)] 形式。我們知道 k~(z)=1hdk(zh)\tilde{k}(z) = \frac{1}{h^d} k(\frac{z}{h}),所以:

    varX(p^(x))1nhdmaxz(k(z))Eμ[1hdk(xμh)]\mathrm{var}_X(\hat{p}(x)) \le \frac{1}{n h^d} \max_z(k(z)) \cdot \mathbb{E}_{\mu} \left[ \frac{1}{h^d} k\left(\frac{x - \mu}{h}\right) \right]

    我們在 (a) 中已經證明過 Eμ[1hdk(xμh)]=EX[p^(x)]\mathbb{E}_{\mu} \left[ \frac{1}{h^d} k\left(\frac{x - \mu}{h}\right) \right] = \mathbb{E}_X[\hat{p}(x)]。替換這整個區塊:

    varX(p^(x))1nhdmaxz(k(z))EX[p^(x)]\mathrm{var}_X(\hat{p}(x)) \le \frac{1}{nh^d} \max_z(k(z)) \mathbb{E}_X[\hat{p}(x)]

    使用題目要求的核心最大值符號 maxx(k(x))\max_x(k(x)),我們就得到了:

    varX(p^(x))1nhdmaxx(k(x))E[p^(x)]\mathrm{var}_X(\hat{p}(x)) \le \frac{1}{nh^d}\max_x(k(x))\mathbb{E}[\hat{p}(x)]