Explain ZH
直觀解釋
這個結果顯示 KDE 模型的分散程度(變異數 )由兩個部分組成:
- 樣本共變異數 ():這代表原始資料點 本身的「寬度」或分散程度。
- 核函數共變異數 ():這代表由平滑核函數(smoothing kernel)引入的「額外寬度」。
當我們建立核密度估計時,我們實際上是拿原始資料分佈(由點質量代表),並透過與寬度為 的核函數進行卷積(convolution)將其「模糊化」。這個模糊化過程自然會將機率質量向外擴散,從而增加總變異數。
與原始樣本變異數相比,估計值的變異數膨脹了 的量。這是合理的:透過平滑化資料,我們讓分佈變得更寬。