Dlaczego Twoi programiści nie potrzebują już RAG Nik Pash z Cline wyjaśnił, dlaczego nie poleca już RAG dla autonomicznych agentów kodowania, a jego punkty uderzyły mocniej, niż się spodziewałem. Warstwa aplikacji kurczy się. Cała sprytna inżynieria, którą budujemy wokół LLMS, staje się przestarzała wraz z ulepszaniem modeli. Co się dzieje z RAG: Okna kontekstowe znacznie się rozszerzyły, dzięki czemu osadzanie wyszukiwania nie było konieczne Agenci kodowania działają lepiej z bezpośrednim dostępem do plików niż z osadzaniem fragmentarycznym Halucynacje nie stanowią nawet problemu, gdy ustawisz temperaturę na 0 Obawy dotyczące bezpieczeństwa związane z osadzaniem pamięci masowej są istotne Zamiast RAG, współcześni programiści, tacy jak Klein, używają tego, co Nik nazywa "integralnością narracyjną". Pozwól agentowi eksplorować kod organicznie za pomocą narzędzi takich jak grep, odczytywać pliki w całości i podążać za własnym tokiem myślenia. Naśladuje to sposób, w jaki faktycznie pracują starsi inżynierowie. Nawet Boris z Cloud Code przyznał, że spróbowali RAG i porzucili go. Wzór jest jasny. Kiedy nadal ma sens: Ograniczenia budżetowe (osadzanie wyszukiwania zużywa mniej tokenów) Ogromne jeziora danych nieustrukturyzowanych Niektóre przypadki użycia niezwiązane z kodowaniem Ale dla poważnych zespołów inżynierskich? Przestań rozpraszać swoich agentów kodowania za pomocą osadzania wyszukiwania. Pozwól im czytać kod bezpośrednio, budować zrozumienie w naturalny sposób i wykonywać z koncentracją. Prawdziwym pytaniem nie jest to, czy RAG jest martwy, ale czy nadal trzymasz się przestarzałych rozwiązań, podczas gdy prostsze podejścia działają teraz lepiej.