Skip to main content

Explain ZH

直觀解釋

這個結果顯示 KDE 模型的分散程度(變異數 Σ^\hat{\Sigma})由兩個部分組成:

  1. 樣本共變異數 (1n(xiμ^)(xiμ^)T\frac{1}{n} \sum (x_i - \hat{\mu})(x_i - \hat{\mu})^T):這代表原始資料點 XX 本身的「寬度」或分散程度。
  2. 核函數共變異數 (HH):這代表由平滑核函數(smoothing kernel)引入的「額外寬度」。

當我們建立核密度估計時,我們實際上是拿原始資料分佈(由點質量代表),並透過與寬度為 HH 的核函數進行卷積(convolution)將其「模糊化」。這個模糊化過程自然會將機率質量向外擴散,從而增加總變異數。

與原始樣本變異數相比,估計值的變異數膨脹HH 的量。這是合理的:透過平滑化資料,我們讓分佈變得更寬。