預備知識
- 泊松分佈 (Poisson Distribution):一種離散概率分佈,表示在固定時間間隔內發生給定數量事件的概率。概率質量函數 (PMF):P(k∣λ)=k!λke−λ。
- 混合模型 (Mixture Model):一種概率模型,用於表示整體群體中存在的子群體。
- 期望最大化 (EM) 算法:一種迭代方法,用於在統計模型依賴於未觀察到的潛在變量時,尋找參數的最大似然或最大後驗 (MAP) 估計。
- E 步:計算給定當前參數下潛在變量的期望值。
- M 步:更新參數以最大化給定預期潛在變量下的似然函數。
分步解答
1. 對數似然函數
設潛在變量 Z={z1,…,zn},其中 zi∈{1,…,K} 指示產生 xi 的分量,或者表示為獨熱向量 zi=[zi1,…,ziK]T。
完整數據的對數似然為:
lnp(X,Z∣θ)=i=1∑nj=1∑Kzijln(πjP(xi∣λj))
=i=1∑nj=1∑Kzij[lnπj+ln(xi!1e−λjλjxi)]
=i=1∑nj=1∑Kzij[lnπj−λj+xilnλj−ln(xi!)]
2. E 步 (期望)
我們計算在給定觀測數據 X 和當前參數 θ(t) 的情況下,潛在變量 zij 的期望值。這個量通常稱為 γij (責任度, responsibility):
γij(t)=E[zij∣xi,θ(t)]=P(zij=1∣xi,θ(t))
使用貝葉斯定理:
γij(t)=∑l=1Kπl(t)P(xi∣λl(t))πj(t)P(xi∣λj(t))
其中 P(xi∣λ)=xi!e−λλxi。
3. M 步 (最大化)
我們針對 θ 最大化完整數據對數似然的期望。Q 函數為:
Q(θ,θ(t))=i=1∑nj=1∑Kγij(t)[lnπj−λj+xilnλj+常數]
更新 πj:
這是在約束 ∑πj=1 下最大化 ∑i=1n∑j=1Kγij(t)lnπj。使用拉格朗日乘數法,我們得到:
πj(t+1)=n1i=1∑nγij(t)=nNj
其中 Nj=∑i=1nγij(t) 是分配給分量 j 的有效數據點數量。
更新 λj:
我們對 Q 函數關於 λj 求導數並設為 0:
∂λj∂Q=i=1∑nγij(t)[−1+λjxi]=0
−i=1∑nγij(t)+λj1i=1∑nγij(t)xi=0
由於 ∑i=1nγij(t)=Nj:
−Nj+λj1i=1∑nγij(t)xi=0
λj(t+1)=Nj∑i=1nγij(t)xi=∑i=1nγij(t)∑i=1nγij(t)xi
與 ML 估計的關係 (問題 2.1)
在問題 2.1 (標準泊松 ML 估計) 中,λ 的最大似然估計僅僅是樣本均值:
λML=n∑i=1nxi
分量 j 的 M 步估計 λj(t+1) 是樣本的加權平均值。
- 每個樣本 xi 不是均等地貢獻(權重 1/n),而是根據其責任度 γij(t)(即樣本 i 屬於分量 j 的概率)進行加權。
- 分母 Nj 是這些權重的總和,用於歸一化估計值。
因此,M 步執行的是針對每個分量的加權最大似然估計,基於當前數據點對該分量的軟分配。