將每個決策視為一個賭注,這個賭注有一個成功的概率和正確的獎勵,以及一個失敗的概率和錯誤的懲罰。通常,贏得的決策是具有正期望值的決策,這意味著獎勵乘以其發生的概率大於懲罰乘以其發生的概率,而最佳的決策是期望值最高的那一個。 #principleoftheday