Искусственный интеллект получил степень доктора и теперь на рынке труда. Представляем Индекс Производительности ИИ (APEX) — эталон, который измеряет, насколько хорошо мы автоматизировали самые ценные отрасли в мире. Большинство эталонов изучают абстрактные возможности. APEX оценивает производительность моделей на реальных результатах в области права, финансов, консалтинга и медицины. Модели, наиболее способные выполнять работу сегодня, согласно APEX: 🥇 GPT 5 🥈 Grok 4 🥉 Gemini 2.5 Flash Другие выводы: - GPT 5 демонстрирует наилучшие результаты во всех 4 областях - Некоторые более дешевые модели превосходят более дорогие модели от того же поставщика (например, Gemini 2.5 Flash против Gemini 2.5 Pro) - Лучшая модель с открытым исходным кодом, Qwen (7-е место), показывает лишь на 2% худшие результаты по сравнению с Grok 4 в целом