Perché i tuoi agenti di codifica non hanno più bisogno di RAG Nik Pash di Cline ha spiegato perché non raccomanda più RAG per gli agenti di codifica autonomi, e i suoi punti hanno colpito più duramente di quanto mi aspettassi. Il livello di applicazione si sta restringendo. Tutta l'ingegneria intelligente che costruiamo intorno agli LLM continua a diventare obsoleta man mano che i modelli migliorano. Cosa sta succedendo con il rag: Le finestre di contesto si sono espanse notevolmente, rendendo superflua l'incorporazione della ricerca Gli agenti di codifica funzionano meglio con l'accesso diretto ai file rispetto agli incorporamenti in blocchi Le allucinazioni non sono nemmeno un problema quando si imposta la temperatura su 0 I problemi di sicurezza relativi all'incorporamento dello storage sono significativi Invece del rag, i moderni agenti di codifica come Klein usano quella che Nik chiama "integrità narrativa". Lasciare che l'agente esplori il codice in modo organico attraverso strumenti come Grep, leggendo i file per intero e seguendo il proprio filo di pensiero. Questo imita il modo in cui lavorano effettivamente gli ingegneri senior. Anche Boris di Cloud Code ha ammesso di aver provato Rag e di averlo abbandonato. Lo schema è chiaro. Quando lo straccio ha ancora senso: Vincoli di budget (l'incorporamento della ricerca utilizza meno token) enormi data lake non strutturati Alcuni casi d'uso non codificati Ma per i team di ingegneri seri? Smetti di distrarre i tuoi agenti di codifica con la ricerca incorporata. Lascia che leggano direttamente il codice, costruiscano la comprensione in modo naturale ed eseguano con concentrazione. La vera domanda non è se il rag è morto, è se ci si aggrappa ancora a soluzioni obsolete quando gli approcci più semplici ora funzionano meglio.