Skip to main content

第 4.5 題 飛行炸彈,第二部分 – 混合卜瓦松分佈的 EM 演算法

讓我們重新考慮第 2.1 題,在那裡我們將卜瓦松分佈 (Poisson distribution) 擬合到擊中倫敦不同區域的飛行炸彈數量。如果我們假設德軍確實以特定區域為目標,那麼對於某些方塊(目標),炸彈擊中率 λ\lambda 會較高,而對其他方塊(非目標)則較低。因此,所有方塊上的分佈應該是一個混合卜瓦松分佈 (mixture of Poissons),其中每一個卜瓦松分量對應於具有特定擊中率的方塊。當 K=2K = 2 時,這些分量將對應於目標方塊和非目標方塊。當 K>2K > 2 時,一個分量對應於目標擊中率,而其他(非目標)分量則具有擊中率的某種漸變(遠離目標方塊的方塊具有較低的擊中率)。

(a) 考慮混合卜瓦松分佈

p(x=kθ)=j=1Kπj1k!eλjλjk,(4.9)p(x = k|\theta) = \sum_{j=1}^K \pi_j \frac{1}{k!} e^{-\lambda_j} \lambda_j^k, \tag{4.9}

其中 λj\lambda_j 是第 jj 個分量的率參數 (rate parameter),而 θ={λj,πj}j=1K\theta = \{\lambda_j, \pi_j\}_{j=1}^K 是該混合模型的參數。請推導 EM 演算法 (EM algorithm),以在給定樣本 X={x1,,xn}X = \{x_1, \cdots, x_n\} 的情況下估計模型的參數。M 步 (M-step) 與單一卜瓦松分佈的最大概似估計 (ML estimate)(第 2.1 題)有何關聯?