AI 擁有博士學位,現在正進入就業市場。 介紹 AI 生產力指數 (APEX),這是一個衡量我們在世界上最有價值的行業中自動化程度的基準。 大多數基準研究抽象能力。APEX 評估模型在法律、金融、諮詢和醫療等實際交付成果上的表現。 根據 APEX,目前最能勝任工作的模型: 🥇 GPT 5 🥈 Grok 4 🥉 Gemini 2.5 Flash 其他發現: - GPT 5 在所有 4 個領域中表現最強 - 一些較便宜的模型在同一供應商中超越了更昂貴的模型(例如:Gemini 2.5 Flash 與 Gemini 2.5 Pro) - 最佳開源模型 Qwen(第 7 名)整體表現僅比 Grok 4 落後 2%