Đi vào đi, kẻ thua cuộc, chúng ta đang mở rộng quy mô các mô hình RL từ đầu.