J'ai enfin trouvé une bonne utilisation pour les sous-agents. Rendre les modèles de politique plus intelligents en construisant automatiquement des environnements RL à partir de données de tâches du monde réel. Putain, ça fonctionne vraiment !