2025年8月:オックスフォードとケンブリッジの数学者が「No LLM Solved Yu Tsumura's 554th Problem」と題する論文を発表。 彼らはこの問題を o3 Pro、Gemini 2.5 Deep Think、Claude Opus 4 (Extended Thinking) などのモデルに「問題を解決するために Web 検索を実行しない」という指示を付けました。 LLMはそれを解決できませんでした。 この論文は独りよがりに主張している:「最近獲得した金メダルに後押しされたLLMの問題解決能力に対する楽観的な見方に反して、津村優の554番目の問題である問題が存在すること、a)証明の洗練度という点ではIMO問題の範囲内であること、b)LLMに問題を引き起こした組み合わせ論の問題ではないこと、 c) 典型的な難しい IMO の問題よりも必要な証明技術が少なくて済み、d) 公開されているソリューション (おそらく LLM のトレーニング データにある)、e) 既存の既製の LLM (商用またはオープンソース) では簡単に解決できない。 (どうやら、これらの数学者は、IMOで金メダルを獲得した未発表のOpenAIとGoogleのモデルが、彼らがテストした公開モデルよりもはるかに強力であるというメモを受け取っていなかったようです。 しかし、関係ありません。 2025 年 10 月: GPT-5 Pro が津村優さんの 554 番目の問題を 15 分で解決しました。 多くの人にとってイ・セドルの瞬間が訪れています。