AI は博士号を取得しており、現在は雇用市場に出回っています。 AI 生産性指数 (APEX) は、世界で最も価値のある業界をどの程度自動化したかを測定するベンチマークです。 ほとんどのベンチマークは抽象的な機能を研究します。APEXは、法律、財務、コンサルティング、医療の実際の成果物に対するモデルのパフォーマンスを評価します。 APEXによると、今日最も作業が可能なモデルは次のとおりです。 🥇 GPT5 🥈 グロック4 🥉 ジェミニ 2.5 フラッシュ その他の調査結果: - GPT 5 は 4 つのドメインすべてで最強のパフォーマンスを発揮します。 - 一部の安価なモデルは、同じプロバイダーのより高価なモデルよりも優れたパフォーマンスを発揮します (例: Gemini 2.5 Flash と Gemini 2.5 Pro)。 - 最高のオープンソースモデルであるQwen(7位)は、全体でGrok 4にわずか2%遅れています