Tekoäly on väitellyt tohtoriksi ja nyt se on työmarkkinoilla. Esittelyssä AI Productivity Index (APEX), vertailuarvo, joka mittaa, kuinka hyvin olemme automatisoineet maailman arvokkaimmat toimialat. Useimmat vertailuarvot tutkivat abstrakteja ominaisuuksia. APEX arvioi mallin suorituskykyä todellisilla suorituksilla, jotka liittyvät lakiin, rahoitukseen, konsultointiin ja lääketieteeseen. APEXin mukaan mallit, jotka pystyvät parhaiten tekemään työtä nykyään: 🥇 GPT 5 🥈 Ryhmä 4 🥉 Gemini 2.5 Flash Muita havaintoja: - GPT 5 osoittaa vahvimman suorituskyvyn kaikilla 4 toimialueella - Jotkut halvemmat mallit ovat parempia kuin saman toimittajan kalliimmat mallit (esim. Gemini 2.5 Flash vs. Gemini 2.5 Pro) - Paras avoimen lähdekoodin malli, Qwen (7.), menestyy vain 2 % Grok 4:stä