Zajímavé je, že mnoho stejných pozorování jsme učinili v našich tvrdých příkladech, které jsou nejlepší pro článek GRPO z minulého měsíce Zahrnutí naučitelného procenta do tréninkové sady vysvětlení tohoto jevu