Piensa en cada decisión como una apuesta con una probabilidad y una recompensa por acertar, y una probabilidad y una penalización por fallar. Normalmente, una decisión ganadora es aquella con un valor esperado positivo, lo que significa que la recompensa multiplicada por su probabilidad de ocurrir es mayor que la penalización multiplicada por su probabilidad de ocurrir, siendo la mejor decisión aquella con el mayor valor esperado. #principleoftheday