Skip to main content

Explain ZH

直觀理解 (Intuition)

「預測分佈 (predictive distribution)」想問的是:「基於目前為止我看到的資料,下一次拋硬幣出現正面的機率是多少?」

貝葉斯方法並不是直接找出一個最有可能的硬幣偏誤值 π\pi 然後代入(這是一般非貝葉斯方法做的),而是將預測結果在所有可能的 π\pi 值上進行平均,並根據每個值的可能性(我們的後驗)來加權。

我們得到的結果 s+1n+2\frac{s+1}{n+2} 非常漂亮。 讓我們將它與標準的 (MLE) 猜測進行比較,後者只是我們看到的正面比例:sn\frac{s}{n}

貝葉斯猜測看起來完全像標準猜測,除了一點,它假裝我們多看了兩次虛擬的拋硬幣結果:一次正面,一次反面。

  • 我們在正面的次數上加 1 (s+1s + 1)。
  • 我們在總拋擲次數上加 2 (n+2n + 2)。

這有什麼用? 想像你只拋了一次硬幣,它落地是正面。

  • 標準數學 (MLE) 顯示 π=1/1=1.0\pi = 1/1 = 1.0。它假設這枚硬幣以後將永遠只出現正面。這是一個武斷的結論!
  • 貝葉斯數學(使用均勻先驗)顯示 π=(1+1)/(1+2)=2/3\pi = (1+1)/(1+2) = 2/3。它實際上是在說:「我看到了一次正面,加上我初始假設的一次虛擬正面和一次虛擬反面。所以我認為它偏向正面,但我還不敢完全確定。」

這種「想像的資料 (imaginary data)」概念稱為拉普拉斯平滑 (Laplace smoothing),它是處理資料不足時的不確定性的絕佳方法,能給出更保守、更穩健的預測。