Agosto 2025: i matematici di Oxford e Cambridge pubblicano un articolo intitolato "Nessun LLM ha risolto il 554° problema di Yu Tsumura". Hanno dato questo problema a o3 Pro, Gemini 2.5 Deep Think, Claude Opus 4 (Pensiero Esteso) e altri modelli, con istruzioni di "non eseguire una ricerca sul web per risolvere il problema". Nessun LLM è riuscito a risolverlo. L'articolo afferma con arroganza: "Mostriamo, contrariamente all'ottimismo riguardo alle capacità di risoluzione dei problemi degli LLM, alimentato dalle recenti medaglie d'oro ottenute, che esiste un problema—il 554° problema di Yu Tsumura—che a) è nell'ambito di un problema IMO in termini di sofisticatezza della prova, b) non è un problema di combinatoria che ha causato problemi agli LLM, c) richiede meno tecniche di prova rispetto ai tipici problemi difficili dell'IMO, d) ha una soluzione pubblicamente disponibile (probabilmente nei dati di addestramento degli LLM), e e) che non può essere facilmente risolto da alcun LLM esistente "off-the-shelf" (commerciale o open-source)." (Apparentemente, questi matematici non hanno ricevuto il messaggio che i modelli non rilasciati di OpenAI e Google che hanno vinto l'oro all'IMO sono significativamente più potenti dei modelli pubblicamente disponibili che hanno testato. Ma non importa.) Ottobre 2025: GPT-5 Pro risolve il 554° problema di Yu Tsumura in 15 minuti. Il momento di Lee Sedol sta arrivando per molti.