August 2025: Mathematiker von Oxford und Cambridge veröffentlichen ein Papier mit dem Titel "Kein LLM hat Yu Tsumuras 554. Problem gelöst". Sie gaben dieses Problem an o3 Pro, Gemini 2.5 Deep Think, Claude Opus 4 (Erweiterte Denkweise) und andere Modelle mit der Anweisung, "keine Websuche zur Lösung des Problems durchzuführen". Kein LLM konnte es lösen. Das Papier behauptet selbstgefällig: "Wir zeigen, entgegen dem Optimismus über die Problemlösungsfähigkeiten von LLMs, angeheizt durch die kürzlich gewonnenen Goldmedaillen, dass ein Problem existiert – Yu Tsumuras 554. Problem – das a) im Rahmen eines IMO-Problems hinsichtlich der Beweissophistizierung liegt, b) kein Kombinatorikproblem ist, was für LLMs Probleme verursacht hat, c) weniger Beweistechniken erfordert als typische schwierige IMO-Probleme, d) eine öffentlich verfügbare Lösung hat (wahrscheinlich in den Trainingsdaten der LLMs) und e) das von keinem bestehenden handelsüblichen LLM (kommerziell oder Open Source) leicht gelöst werden kann." (Offensichtlich haben diese Mathematiker nicht die Nachricht erhalten, dass die unveröffentlichten Modelle von OpenAI und Google, die Gold bei der IMO gewonnen haben, erheblich leistungsfähiger sind als die öffentlich verfügbaren Modelle, die sie getestet haben. Aber egal.) Oktober 2025: GPT-5 Pro löst Yu Tsumuras 554. Problem in 15 Minuten. Der Lee Sedol-Moment kommt für viele.