Explain ZH
指數混合模型 EM 推導詳解
期望最大化 (EM) 演算法是在具有隱變量 (Hidden Variables) 的模型中尋找最大概似估計的標準工具。在混合模型中,「隱」變量是指生成每個數據點的分量 ID。我們不知道哪個指數分佈生成了哪個 ,所以我們必須以機率的方式進行估計。
1. E 步驟:猜測標籤
「期望」步驟 (E-step) 基本上是在問:「給定我們目前的參數估計 ,數據點 來自其分量 的可能性有多大?」
這個機率被稱為 責任值 (Responsibility),記為 。
- 分子 是「選中分量 且觀察到 」的聯合機率。
- 分母是「觀察到 」的總機率(所有可能分量的總和,即全機率公式)。
- 結果是一個歸一化的機率(對於每個 ,對所有 求和為 1)。
2. M 步驟:更新參數
「最大化」步驟 (M-step) 是在問:「給定我們先前對標籤的軟猜測 (),最佳的參數是什麼?」
我們最大化 Q 函數,即期望對數概似函數。這有效地將問題分開,使我們可以將每個分量視為獨立的問題來處理,並以責任值作為權重。
更新 (混合係數)
的更新直觀上就是分配機率的統計平均值。
這意味著:「分量 的機率是該分量對所有數據點平均承擔的責任。」如果分量 1 對每個點都承擔了 30% 的責任,那麼 就應該是 0.3。
更新 (速率參數)
對於標準的指數分佈, 的 MLE 是 。
在混合情況下,我們有一個 加權 版本。
- 分子 是分配給分量 的「有效點數」(通常記為 )。
- 分母 是分配給分量 的「數值加權和」。
所以更新公式實際上是:
這與單一指數分佈的直觀概念一致,但根據每個點屬於該分量的程度進行了加權。