(a) 對角協方差矩陣
預備知識
- 對角矩陣的行列式:對角矩陣的行列式是其對角線元素的乘積。
- 對角矩陣的逆矩陣:對角矩陣的逆矩陣是一個對角矩陣,其元素是原對角線元素的倒數。
- 指數規則:ea+b=eaeb 和 exp(∑xi)=∏exp(xi)。
- 單變量高斯 PDF:N(xi∣μi,σi2)=2πσi21e−2σi2(xi−μi)2。
逐步解答
-
分析行列式項:
給定對角協方差矩陣 Σ=diag(σ12,…,σd2),其行列式為:
∣Σ∣=i=1∏dσi2
取平方根:
∣Σ∣1/2=(i=1∏dσi2)1/2=i=1∏dσi
-
分析馬些路距離 (Mahalanobis distance) 項:
對角矩陣 Σ 的逆矩陣為:
Σ−1=diag(σ121,…,σd21)
展開內部項 ∥x−μ∥Σ2=(x−μ)TΣ−1(x−μ):
(x−μ)TΣ−1(x−μ)=[x1−μ1⋯xd−μd]σ1210⋱0σd21x1−μ1⋮xd−μd=i=1∑dσi2(xi−μi)2
-
代回完整的 PDF:
p(x)=(2π)d/2∏i=1dσi1exp(−21i=1∑dσi2(xi−μi)2)
-
因式分解表達式:
將 (2π)d/2 分配為 ∏i=1d(2π)1/2,並將指數和分離為乘積:
p(x)=(i=1∏d(2π)1/2σi1)i=1∏dexp(−2σi2(xi−μi)2)=i=1∏d(2πσi1e−2σi2(xi−μi)2)=i=1∏dN(xi∣μi,σi2)
這表明聯合密度是獨立單變量邊緣密度的乘積。
(b) 具有對角協方差的二維高斯
預備知識
- 等高線圖:使用等值線在二維平面上可視化三維函數。
- 橢圓方程式:a2x2+b2y2=1。
逐步解答
給定 μ=[00] 和 Σ=[1000.25]。
-
方差:
σ12=1⟹σ1=1.
σ22=0.25⟹σ2=0.5.
-
馬些路距離:
∥x−μ∥Σ2=1x12+0.25x22=x12+4x22
密度為常數的水平集(等高線)滿足 x12+4x22=C。這是以 (0,0) 為中心的橢圓方程式。
-
形狀描述:
- 橢圓的半長軸沿著 x1(長度正比於 σ1=1)。
- 半短軸沿著 x2(長度正比於 σ2=0.5)。
- 效果:密度是「軸對齊」的。因為 σ1>σ2,分佈沿 x1 軸拉伸並沿 x2 軸壓縮。它看起來像一個扁平的橢圓。
(c) 各向同性協方差矩陣
預備知識
- 各向同性:具有在不同方向測量時具有相同值的物理屬性。
- 單位矩陣:對角線上為 1 而其他地方為 0 的矩陣。
逐步解答
給定 Σ=[1001]。
-
方差:
σ12=1,σ22=1.
-
馬些路距離:
∥x−μ∥Σ2=x12+x22
等高線滿足 x12+x22=C,這是圓的方程式。
-
形狀描述:
等高線是完美的圓形。概率密度從中心向各個方向以相同的速率下降。擴散是對稱的(在更高維度中為球形)。
(d) 協方差矩陣的特徵分解
預備知識
- 譜定理:任何對稱實矩陣都可以由其特徵向量的正交矩陣進行對角化。
- 矩陣乘法:結合律性質。
逐步解答
-
特徵值方程式:
已知 Σvi=λivi 對於 i=1,…,d。
-
矩陣形式:
我們可以將向量 vi 堆疊成矩陣 V=[v1,…,vd],並將純量堆疊成對角矩陣 Λ=diag(λ1,…,λd)。
方程組 Σvi=λivi 變為:
ΣV=VΛ
-
正交性:
由於 Σ 是對稱矩陣(協方差矩陣是對稱的),其特徵向量 vi 可以選擇為正交歸一的(互相正交且長度為單位長度)。
因此,V 是一個正交矩陣,意味著 VTV=I 或 V−1=VT。
-
對角化:
將方程式 ΣV=VΛ 右乘 VT:
ΣVVT=VΛVT
由於 VVT=I:
Σ=VΛVT
(e) 變換到對角空間
預備知識
- 分解矩陣的逆矩陣:(ABC)−1=C−1B−1A−1。
- 向量性質:(Ax)T=xTAT。
逐步解答
-
Σ 的逆矩陣:
使用 (d) 中的分解:
Σ−1=(VΛVT)−1=(VT)−1Λ−1V−1
因為 V 是正交的(V−1=VT 且 (VT)−1=V):
Σ−1=VΛ−1VT
-
代入馬些路距離:
∥x−μ∥Σ2=(x−μ)TVΛ−1VT(x−μ)
-
定義 y:
令 y=VT(x−μ)。則其轉置為 yT=(x−μ)TV。
將 y 代入距離方程式:
∥x−μ∥Σ2=yTΛ−1y
-
結果:
由於 Λ 是對角矩陣,yTΛ−1y=∥y∥Λ2。
這表明在由 y 定義的坐標系中,變量是不相關的(對角協方差 Λ)。
(f) V 和 μ 的幾何效應
預備知識
- 基底變換:將向量投影到新的基底向量上。
- 仿射變換:線性變換後進行平移。
逐步解答
關係式為 x=Vy+μ(由 y=VT(x−μ) 推導出,通過乘以 V 並加上 μ)。
-
變換 V 的效果(旋轉):
V 包含 Σ 的特徵向量。將向量 y 乘以正交矩陣 V 執行坐標系的 旋轉(或反射)。
具體來說,y 空間中的標準軸(高斯分佈在此處是軸對齊的)被旋轉以與 x 空間中的特徵向量 vi 對齊。
-
變換 μ 的效果(平移):
加上 μ 會移動原點。分佈的中心從 0(在 y 空間中,如果我們考慮中心化的 y)移動到 x 空間中的 μ。
-
總結:
要生成樣本 x,你從軸對齊的高斯中取一個樣本 y,將其通過 V 進行 旋轉,並通過 μ 進行 平移。
(g) 一般協方差矩陣圖
預備知識
- 特徵方程式:det(Σ−λI)=0 用於求特徵值。
- 特徵向量:求解 (Σ−λI)v=0。
逐步解答
給定 Σ=[0.6250.3750.3750.625]。
-
尋找特徵值:
det[0.625−λ0.3750.3750.625−λ]=0
(0.625−λ)2−0.3752=0
0.625−λ=±0.375
λ1=0.625+0.375=1.0
λ2=0.625−0.375=0.25
-
尋找特徵向量:
-
對於 λ1=1:
[−0.3750.3750.375−0.375][v11v12]=0⟹v11=v12.
歸一化特徵向量:v1=[2121]≈[0.7070.707]。(45∘ 線方向)。
-
對於 λ2=0.25:
[0.3750.3750.3750.375][v21v22]=0⟹v21=−v22.
歸一化特徵向量:v2=[−2121]≈[−0.7070.707]。(135∘ 線方向)。
-
形狀描述:
- 特徵值為 1 和 0.25,這與 (b) 部分的方差相同。
- 特徵值的效果:它們決定了不確定性橢圓的長軸和短軸的長度。(長軸長度正比於 1,短軸正比於 0.25)。
- 特徵向量的效果:它們決定了 方向。(b) 部分的橢圓逆時針旋轉了 45∘。分佈沿著 x1=x2 線拉長。