Interessant genoeg hebben we veel van dezelfde observaties gemaakt in onze moeilijke voorbeelden die het beste zijn voor het GRPO-papier van vorige maand Inclusief het leerbare percentage in de uitleg van de trainingsset voor dit fenomeen