Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Dlaczego Twoi programiści nie potrzebują już RAG
Nik Pash z Cline wyjaśnił, dlaczego nie poleca już RAG dla autonomicznych agentów kodowania, a jego punkty uderzyły mocniej, niż się spodziewałem.
Warstwa aplikacji kurczy się. Cała sprytna inżynieria, którą budujemy wokół LLMS, staje się przestarzała wraz z ulepszaniem modeli.
Co się dzieje z RAG:
Okna kontekstowe znacznie się rozszerzyły, dzięki czemu osadzanie wyszukiwania nie było konieczne
Agenci kodowania działają lepiej z bezpośrednim dostępem do plików niż z osadzaniem fragmentarycznym
Halucynacje nie stanowią nawet problemu, gdy ustawisz temperaturę na 0
Obawy dotyczące bezpieczeństwa związane z osadzaniem pamięci masowej są istotne
Zamiast RAG, współcześni programiści, tacy jak Klein, używają tego, co Nik nazywa "integralnością narracyjną". Pozwól agentowi eksplorować kod organicznie za pomocą narzędzi takich jak grep, odczytywać pliki w całości i podążać za własnym tokiem myślenia. Naśladuje to sposób, w jaki faktycznie pracują starsi inżynierowie.
Nawet Boris z Cloud Code przyznał, że spróbowali RAG i porzucili go. Wzór jest jasny.
Kiedy nadal ma sens:
Ograniczenia budżetowe (osadzanie wyszukiwania zużywa mniej tokenów)
Ogromne jeziora danych nieustrukturyzowanych
Niektóre przypadki użycia niezwiązane z kodowaniem
Ale dla poważnych zespołów inżynierskich? Przestań rozpraszać swoich agentów kodowania za pomocą osadzania wyszukiwania. Pozwól im czytać kod bezpośrednio, budować zrozumienie w naturalny sposób i wykonywać z koncentracją.
Prawdziwym pytaniem nie jest to, czy RAG jest martwy, ale czy nadal trzymasz się przestarzałych rozwiązań, podczas gdy prostsze podejścia działają teraz lepiej.
Najlepsze
Ranking
Ulubione