2025年8月:牛津和劍橋的數學家發表了一篇題為《沒有LLM解決的Yu Tsumura的第554個問題》的論文。 他們將這個問題交給了o3 Pro、Gemini 2.5 Deep Think、Claude Opus 4(擴展思考)和其他模型,並指示他們「不要進行網絡搜索來解決這個問題」。沒有任何LLM能夠解決它。 這篇論文自鳴得意地聲稱:「我們顯示,與對LLM解決問題能力的樂觀預期相反,這種預期是由最近獲得的金牌所推動的,存在一個問題——Yu Tsumura的第554個問題——該問題a) 在證明的複雜性上屬於IMO問題的範疇,b) 不是一個組合問題,這對LLM造成了困擾,c) 需要的證明技術比典型的困難IMO問題少,d) 有一個公開可用的解決方案(可能在LLM的訓練數據中),並且e) 不能被任何現有的現成LLM(商業或開源)輕易解決。」 (顯然,這些數學家沒有收到消息,未發布的OpenAI和Google模型在IMO上獲得金牌的能力遠超他們測試的公開可用模型。但無所謂。) 2025年10月:GPT-5 Pro在15分鐘內解決了Yu Tsumura的第554個問題。 Lee Sedol的時刻即將來臨。