La IA tiene su doctorado y ahora está en el mercado laboral. Presentamos el Índice de Productividad de IA (APEX), un referente que mide qué tan bien hemos automatizado las industrias más valiosas del mundo. La mayoría de los referentes estudian capacidades abstractas. APEX evalúa el rendimiento de los modelos en entregables reales en derecho, finanzas, consultoría y medicina. Los modelos más capaces de realizar trabajo hoy en día, según APEX: 🥇 GPT 5 🥈 Grok 4 🥉 Gemini 2.5 Flash Otros hallazgos: - GPT 5 demuestra el mejor rendimiento en los 4 dominios - Algunos modelos más baratos superan a modelos más caros del mismo proveedor (por ejemplo, Gemini 2.5 Flash vs. Gemini 2.5 Pro) - El mejor modelo de código abierto, Qwen (7º), rinde solo un 2% menos que Grok 4 en general