🚀 Агенты жестко справляются с проблемами SWE Bench + Polyglot benchmark