Si vieras cómo las personas realmente utilizan los agentes de codificación, te darías cuenta de que el punto de Andrej es muy cierto. Las personas que los mantienen bajo control, utilizando hilos cortos, leyendo y revisando todo el código, pueden obtener mucho valor de los agentes de codificación. Las personas que se vuelven locas tienen una rápida euforia, pero luego se dan cuenta rápidamente de que están obteniendo un valor negativo. Para un agente de codificación, acertar en lo básico (por ejemplo, que los agentes puedan construir/probar tu código de manera confiable y mínima, y una gran interfaz para la revisión de código y la colaboración humano-agente) >>> WhateverBench y "horas de autonomía" para arneses de agentes y 10 subagentes paralelos con margen de especificación.