Jeg hørte at forsterkende læring bare fungerer med verifiserbare belønninger? 😛 Congrats!!