Skip to main content

Question ZH

問題 4.5 飛行炸彈,第二部分 – 泊松混合模型的 EM 算法

讓我們重新考慮 [問題 2.1],在那裡我們對襲擊倫敦不同區域的飛行炸彈數量擬合了一個泊松分佈。如果我們假設德國人確實鎖定了特定區域,那麼某些方格(目標)的炸彈命中率 λ\lambda 會較高,而其他方格(非目標)的命中率會較低。因此,所有方格的分佈應該是泊松分佈的混合,其中每個泊松分量對應於具有特定命中率的方格。對於 K=2K=2,分量將分別對應於目標方格和非目標方格。對於 K>2K > 2,一個分量對應於目標命中率,而其他(非目標)分量則具有某種命中率的層次(遠離目標方格的方格具有較低的命中率)。

(a) 考慮泊松混合分佈

p(x=kθ)=j=1Kπj1k!eλjλjk,p(x=k|\theta) = \sum_{j=1}^K \pi_j \frac{1}{k!} e^{-\lambda_j} \lambda_j^k,

其中 λj\lambda_j 是第 jj 個分量的速率參數,θ={λj,πj}j=1K\theta = \{\lambda_j, \pi_j\}_{j=1}^K 是混合模型的參數。推導 EM 算法以在給定樣本 X={x1,,xn}X = \{x_1, \dots, x_n\} 的情況下估計模型的參數。M 步與泊松分佈的 ML 估計(問題 2.1)有何關係?