Почему вашим агентам по кодированию больше не нужна RAG Ник Паш из Cline объяснил, почему он больше не рекомендует RAG для автономных агентов кодирования, и его замечания ударили сильнее, чем я ожидал. Слой приложения сжимается. Все умные разработки, которые мы строим вокруг LLM, устаревают по мере совершенствования моделей. Что происходит с тряпкой: Контекстные окна значительно расширены, что сделало ненужным встраивание поиска Агенты кодирования лучше работают с прямым доступом к файлам, чем с фрагментированными встраиваниями Галлюцинации даже не являются проблемой, если вы установите температуру на 0 Проблемы безопасности при встраивании хранилища значительны Вместо RAG современные кодировщики, такие как Кляйн, используют то, что Ник называет «нарративной целостностью». Это позволяет агенту органично изучать код с помощью таких инструментов, как grep, считывать файлы в полном объеме и следовать своему собственному ходу мыслей. Это имитирует то, как на самом деле работают старшие инженеры. Даже Борис из Cloud Code признал, что они попробовали Rag и отказались от него. Закономерность очевидна. Когда тряпка еще имеет смысл: бюджетные ограничения (при внедрении поиска используется меньше токенов) Огромные озера неструктурированных данных Некоторые варианты использования, не связанные с программированием Но для серьезных инженерных команд? Хватит отвлекать агентов программирования на поиск встраивания. Позвольте им прочитать код напрямую, развить понимание естественным образом и сосредоточиться на выполнении. Настоящий вопрос не в том, мертва ли тряпка, а в том, цепляетесь ли вы все еще за устаревшие решения, когда более простые подходы теперь работают лучше.