輸出與結果 (Output & Results)
為了應用在 (a) 部分推導得到的 EM 演算法,我們將資料表示為陣列 ,其中每一個元素對應城市中一個網格 (Square) 的擊中次數。倫敦的樣本數 為 。安特衛普的樣本數 則是 。
(注意:為了計算方便和推導精確的期望值,通常將「5 次及以上」的類別近似為剛好 5 次。若要建立精確的模型,可考慮使用截斷卜瓦松概似函數 (Truncated Poisson likelihood)。)
對 執行 EM 演算法並計算其對數概似值 (Log-likelihood),以及為避免過擬合 (Overfitting) 所計算的貝氏信息準則 (Bayesian Information Criterion, BIC),可獲得以下典型的結果(確切輸出可能因隨機初始化而略有差異,但最終會收斂至最佳值):
倫敦 (London)
| 對數概似值 (Log-Likelihood, ) | BIC | 參數 () | |
|---|---|---|---|
| 1 | -728.71 | 1463 | |
| 2 | -728.71 | 1476 | |
| 3 | -728.70 | 1489 |
對於倫敦,將 增加至超過 並未對對數概似值帶來任何有意義的改善(各分量會崩塌合併,或者僅是複製全域平均值)。因此,BIC 嚴厲懲罰了較高的 。
安特衛普 (Antwerp)
| 對數概似值 (Log-Likelihood, ) | BIC | 參數 () | |
|---|---|---|---|
| 1 | -830.70 | 1667 | |
| 2 | -748.02 | 1515 | |
| 3 | -747.78 | 1527 |
對於安特衛普,從 增加至 後,對數概似值大幅提升()。BIC 分數在 時達到全域最小值 (Global minimum)。添加更多的分量()所帶來的效益極小,並會導致更高的 BIC 分数。
結論與解釋 (Conclusion & Interpretation)
倫敦:無差別轟炸 (Indiscriminate Bombing)
對於倫敦,最佳的分量數量為 。這個混合模型基本上退化回一個 的單一卜瓦松分佈。這與原始資料的平均值等於變異數()的特性完全吻合。 沒有證據表明有特定目標。飛行炸彈在倫敦市網格中的分佈,完美對應一個純隨機點過程 (Random point pattern)。炸彈是任意落下的。
安特衛普:針對性轟炸 (Targeted Bombing)
對於安特衛普,資料表現出極大的過度離散 (Overdispersion)——變異數()遠高於平均值()。最佳的混合模型強烈傾向於 的情況。 經過訓練的模型揭示了兩個截然不同的潛在分佈:
- 低擊中分量 (Low-Hit Component)(): 城市中約有 66% 的地區炸彈擊中率極低。這可能是沒有被針對的住宅區或郊區。
- 高擊中分量 (High-Hit Component)(): 城市中約有 34% 的地區經歷了猛烈的轟炸,承受著幾乎是低擊中地區的 10 倍炸彈密度。
這些結果提供了強有力的證據,表明針對安特衛普的攻擊是具有目標性的。德軍極有可能鎖定了特定的基礎設施或戰略要地(如港口、鐵路等),導致全城約三分之一的網格遭到密集攻擊,而其餘地區則大多完好無損。