Skip to main content

Explain ZH

直觀理解

想像你正試圖根據一個人的身高 (xx) 來猜測他的體重 (yy)。你知道特定身高的人的體重分佈,p(yx)p(y|x)

如果你猜測的體重是 g(x)g(x),而實際體重是 yy,你的「懲罰」或「損失」是你猜測值與真實值之間差值的平方:(g(x)y)2(g(x) - y)^2。這意味著誤差 2 公斤的懲罰是誤差 1 公斤的四倍。巨大的誤差會受到非常嚴厲的懲罰。

因為巨大的誤差代價如此之高,你會想要選擇一個能平衡極端情況的猜測值。你不希望選擇一個可能距離某個極可能發生的真實值非常遠的數值。

在數學上,能使到分佈中所有點的距離平方和最小化的值就是平均值 (mean)。可以把平均值想像成分佈的「質心」。如果你把猜測值放在質心上,你就能最小化到所有可能實際體重的距離平方。

因此,為了最小化你的預期平方懲罰,你最好的猜測就是所有該身高的人的平均體重:條件期望值 E[yx]\mathbb{E}[y|x]