Skip to main content

問題 3.8(a) 解釋

似然函數 (Likelihood Function) 的概念

函數 p(Dπ)p(\mathcal{D}|\pi) 被稱為 似然函數。它告訴我們對於特定的參數值 π\pi,觀測到的數據 D\mathcal{D} 出現的可能性有多大。

  • 如果我們觀察一次擲硬幣 (n=1n=1),如果是正面 (x=1x=1),似然度就是 π\pi;如果是反面 (x=0x=0),似然度就是 1π1-\pi
  • 當我們觀察 nn 次重複的獨立投擲時,聯合概率是單個概率的乘積。

推導邏輯

推導的核心依賴於計數結果。 由於伯努利變數 xix_i 只能是 0 或 1:

  • xi=1x_i = 1 時,該項貢獻一個因子 π\pi
  • xi=0x_i = 0 時,該項貢獻一個因子 (1π)(1-\pi)

因此,如果我們觀察到序列 1,0,1,1,01, 0, 1, 1, 0

  • 我們有三個 11 和兩個 00
  • 概率是 π(1π)ππ(1π)=π3(1π)2\pi \cdot (1-\pi) \cdot \pi \cdot \pi \cdot (1-\pi) = \pi^3 (1-\pi)^2
  • 這裡,n=5n=5,總和 s=1+0+1+1+0=3s = 1+0+1+1+0 = 3
  • 00 的數量是 ns=53=2n-s = 5-3 = 2
  • 公式 πs(1π)ns\pi^s (1-\pi)^{n-s} 概括了這個計數過程。

充分統計量 (Sufficient Statistic)

s=xis = \sum x_i 被稱為 π\pi充分統計量。這意味著 ss 包含了數據 D\mathcal{D} 中與估計 π\pi 相關的 所有 信息。知道正面和反面的確切順序(例如,我們是得到 HHT 還是 HTH)並不改變我們對偏差 π\pi 的估計;只有正面總數 (ss) 和投擲總數 (nn) 是重要的。

結果 p(Dπ)=πs(1π)nsp(\mathcal{D}|\pi) = \pi^s (1-\pi)^{n-s} 基本上表明似然函數僅通過 ss 依賴於數據。