-
定義條件風險:
給定輸入 x 和決策函數 g(x) 的條件風險 R(x),是在條件分佈 p(y∣x) 下的預期損失:
R(x)=Ey∣x[L(g(x),y)]=∫L(g(x),y)p(y∣x)dy
-
代入平方損失函數:
已知 L(g(x),y)=(g(x)−y)2,我們將其代入風險方程式中:
R(x)=∫(g(x)−y)2p(y∣x)dy
-
最小化條件風險:
為了找到最小化 R(x) 的最佳決策函數 g∗(x),我們對 R(x) 關於 g(x) 取導數並將其設為零。
∂g(x)∂R(x)=∂g(x)∂∫(g(x)−y)2p(y∣x)dy
假設我們可以交換微分和積分的順序(萊布尼茲積分法則):
∂g(x)∂R(x)=∫∂g(x)∂(g(x)−y)2p(y∣x)dy
∂g(x)∂R(x)=∫2(g(x)−y)p(y∣x)dy
-
將導數設為零:
∫2(g(x)−y)p(y∣x)dy=0
2∫g(x)p(y∣x)dy−2∫yp(y∣x)dy=0
因為 g(x) 不依賴於 y,我們可以將其提出第一個積分:
g(x)∫p(y∣x)dy=∫yp(y∣x)dy
-
求解 g(x):
我們知道機率密度函數在其整個定義域上的積分為 1,所以 ∫p(y∣x)dy=1。
g(x)⋅1=∫yp(y∣x)dy
右邊是給定 x 時 y 的條件期望值的定義。
g∗(x)=E[y∣x]