AI 拥有博士学位,现在正在求职市场上。 介绍 AI 生产力指数 (APEX),这是一个衡量我们在全球最有价值行业中自动化程度的基准。 大多数基准研究抽象能力。APEX 评估模型在法律、金融、咨询和医学等领域的实际交付能力。 根据 APEX,目前最能胜任工作的模型: 🥇 GPT 5 🥈 Grok 4 🥉 Gemini 2.5 Flash 其他发现: - GPT 5 在所有 4 个领域表现最强 - 一些便宜的模型在同一提供商中超越了更昂贵的模型(例如,Gemini 2.5 Flash vs. Gemini 2.5 Pro) - 最好的开源模型 Qwen(第 7 位)整体表现仅比 Grok 4 落后 2%