Wenn Sie sehen würden, wie Menschen tatsächlich Codierungsagenten nutzen, würden Sie erkennen, dass Andrejs Punkt sehr wahr ist. Menschen, die sie an der kurzen Leine halten, kurze Threads verwenden, den gesamten Code lesen und überprüfen, können viel Wert aus Codierungsagenten ziehen. Menschen, die verrückt werden, haben einen schnellen Höhenflug, merken dann aber schnell, dass sie negativen Wert erhalten. Für einen Codierungsagenten ist es wichtig, die Grundlagen richtig zu machen (z. B. dass Agenten in der Lage sind, Ihren Code zuverlässig und minimal zu erstellen/zu testen, und eine großartige Schnittstelle für die Codeüberprüfung und die Zusammenarbeit zwischen Mensch und Agent) >>> WhateverBench und "Stunden der Autonomie" für Agenten-Harnesse und 10 parallele Unteragenten mit Spezifikationsschwankungen.