Tôi đã phát triển các môi trường trong suốt tuần qua. Tôi tin rằng điều này có thể giải quyết nhu cầu về môi trường RL của đại chúng. Có rất nhiều thứ thú vị và tuyệt vời để thử nghiệm, bao gồm môi trường chứng minh Lean4 đa lượt StepRunProver mà tôi đã tạo ra.