熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
2025年8月:牛津和劍橋的數學家發表了一篇題為《沒有LLM解決的Yu Tsumura的第554個問題》的論文。
他們將這個問題交給了o3 Pro、Gemini 2.5 Deep Think、Claude Opus 4(擴展思考)和其他模型,並指示他們「不要進行網絡搜索來解決這個問題」。沒有任何LLM能夠解決它。
這篇論文自鳴得意地聲稱:「我們顯示,與對LLM解決問題能力的樂觀預期相反,這種預期是由最近獲得的金牌所推動的,存在一個問題——Yu Tsumura的第554個問題——該問題a) 在證明的複雜性上屬於IMO問題的範疇,b) 不是一個組合問題,這對LLM造成了困擾,c) 需要的證明技術比典型的困難IMO問題少,d) 有一個公開可用的解決方案(可能在LLM的訓練數據中),並且e) 不能被任何現有的現成LLM(商業或開源)輕易解決。」
(顯然,這些數學家沒有收到消息,未發布的OpenAI和Google模型在IMO上獲得金牌的能力遠超他們測試的公開可用模型。但無所謂。)
2025年10月:GPT-5 Pro在15分鐘內解決了Yu Tsumura的第554個問題。
Lee Sedol的時刻即將來臨。
熱門
排行
收藏