AI har sin doktorsexamen och nu är den på arbetsmarknaden. Vi introducerar AI Productivity Index (APEX), ett riktmärke som mäter hur väl vi har automatiserat de mest värdefulla branscherna i världen. De flesta benchmarks studerar abstrakta förmågor. APEX utvärderar modellens prestanda på verkliga leveranser inom juridik, ekonomi, konsultverksamhet och medicin. De modeller som är mest kapabla att utföra arbete idag, enligt APEX: 🥇 GPT 5 🥈 Grok 4 🥉 Tvillingarna 2,5 Flash Andra resultat: - GPT 5 uppvisar den starkaste prestandan på alla 4 domäner. - Vissa billigare modeller presterar bättre än dyrare modeller från samma leverantör (t.ex. Gemini 2.5 Flash vs. Gemini 2.5 Pro) - Den bästa modellen med öppen källkod, Qwen (7:e), presterar bara 2 % efter Grok 4 totalt sett.