必備知識
要解決此問題,您需要熟悉以下概念:
- 多變量高斯定義:
N(x∣μ,Σ)=(2π)d/2∣Σ∣1/21exp(−21(x−μ)TΣ−1(x−μ))
- 配方:正如在 習題 1.10 中推導的那樣,二次形式 xTAx−2xTb 可以配方為 (x−A−1b)TA(x−A−1b)−bTA−1b。
- 矩陣恆等式:
- (A−1+B−1)−1=A(A+B)−1B=B(A+B)−1A (用於行列式運算)。
- 二次型的恆等式:
aTA−1a+bTB−1b−(A−1a+B−1b)T(A−1+B−1)−1(A−1a+B−1b)=(a−b)T(A+B)−1(a−b)。
逐步推導
我們先計算乘積:
P(x)=N(x∣a,A)N(x∣b,B)
步驟 1:展開指數
暫時忽略歸一化常數,讓我們看看指數項 E (總指數為 −21E):
E=(x−a)TA−1(x−a)+(x−b)TB−1(x−b)
展開這些二次項:
E=(xTA−1x−2xTA−1a+aTA−1a)+(xTB−1x−2xTB−1b+bTB−1b)
按 x 的冪次分組:
E=xT(A−1+B−1)x−2xT(A−1a+B−1b)+(aTA−1a+bTB−1b)
步驟 2:定義新參數 c 和 C
我們想要匹配高斯指數的形式:(x−c)TC−1(x−c)。
觀察 x 的二次項,我們識別出精度矩陣等於精度的和:
C−1=A−1+B−1⟹C=(A−1+B−1)−1
這符合公式 (1.25)。
觀察線性項 −2xT(A−1a+B−1b),我們將其等同于 (x−c)TC−1(x−c) 展開式中的 −2xTC−1c。
C−1c=A−1a+B−1b
從左側乘以 C:
c=C(A−1a+B−1b)
這符合公式 (1.24)。
步驟 3:配方
利用習題 1.10 的結果,我們可以重寫 E 中涉及 x 的項:
xTC−1x−2xT(C−1c)=(x−c)TC−1(x−c)−cTC−1c
將其代回 E 的表達式:
E=(x−c)TC−1(x−c)−cTC−1c+(aTA−1a+bTB−1b)
設 R 為剩餘的標量項:
R=aTA−1a+bTB−1b−cTC−1c
因此乘積 P(x) 可以寫為:
P(x)=Z∗norm1exp(−21(x−c)TC−1(x−c))exp(−21R)
其中 Z∗norm=(2π)d/2∣A∣1/2(2π)d/2∣B∣1/2=(2π)d∣A∣1/2∣B∣1/2。
注意 exp(−21(x−c)TC−1(x−c)) 是 N(x∣c,C) 的未歸一化核。
步驟 4:簡化剩餘項 R
我們需要證明 R=(a−b)T(A+B)−1(a−b)。
將 c=C(A−1a+B−1b) 和 C−1=A−1+B−1 代回 cTC−1c:
cTC−1c=(A−1a+B−1b)TCTC−1C(A−1a+B−1b)
=(A−1a+B−1b)TC(A−1a+B−1b)
因此,
R=aTA−1a+bTB−1b−(A−1a+B−1b)T(A−1+B−1)−1(A−1a+B−1b)
利用矩陣恆等式(可通過 Woodbury 公式或基本代數證明)在指數中配方:
xTA−1x+yTB−1y−(A−1x+B−1y)T(A−1+B−1)−1(A−1x+B−1y)=(x−y)T(A+B)−1(x−y)
代入 x=a,y=b:
R=(a−b)T(A+B)−1(a−b)
此項完全匹配 N(a∣b,A+B) 的指數。
步驟 5:確定縮放因子 Z
我們有:
N(x∣a,A)N(x∣b,B)=N(x∣c,C)⋅(2π)d∣A∣1/2∣B∣1/2(2π)d/2∣C∣1/2exp(−21R)_Z
我們確認了 exp(−21R) 匹配 N(a∣b,A+B) 的指數部分。
現在檢查行列式前因子。
前因子=(2π)d/2∣A∣1/2∣B∣1/2∣C∣1/2
我們希望這與 N(a∣b,A+B) 的常數匹配,即 (2π)d/2∣A+B∣1/21。
我們需要檢查是否:
∣A∣1/2∣B∣1/2∣C∣1/2=∣A+B∣1/21
兩邊平方:
∣A∣∣B∣∣C∣=∣A+B∣1⟺∣C∣∣A+B∣=∣A∣∣B∣
回憶 C=(A−1+B−1)−1。
利用 ∣XY∣=∣X∣∣Y∣ 和 ∣X−1∣=1/∣X∣:
∣C∣=∣(A−1+B−1)−1∣=∣A−1+B−1∣1=∣A−1(A+B)B−1∣1
=∣A−1∣∣A+B∣∣B−1∣1=∣A+B∣∣A∣∣B∣
因此,行列式匹配。
結合剩餘指數和行列式因子,我們得到:
Z=(2π)d/2∣A+B∣1/21exp(−21(a−b)T(A+B)−1(a−b))=N(a∣b,A+B)
所以,
N(x∣a,A)N(x∣b,B)=ZN(x∣c,C)
證畢。