W końcu znalazłem dobry przypadek użycia dla subagentów. Uczynienie modeli polityki mądrzejszymi poprzez automatyczne budowanie środowisk RL z danych o zadaniach z rzeczywistego świata. Kurwa, to naprawdę działa