.@RichardSSutton, părintele învățării prin întărire, nu crede că LLM-urile sunt lipsite de lecții amare. Omul meu de oțel despre poziția lui Richard: avem nevoie de o arhitectură nouă pentru a permite învățarea continuă (la locul de muncă). Și dacă avem învățare continuă, nu avem nevoie de o fază specială de antrenament - agentul învață din mers - ca toți oamenii și, într-adevăr, ca toate animalele. Această nouă paradigmă va face ca abordarea noastră actuală cu LLM-urile să fie învechită. Am făcut tot posibilul să reprezint opinia că LLM-urile vor funcționa ca fundație pe care se poate întâmpla această învățare experiențială. Au zburat niște scântei. 0:00:00 – Sunt LLM-urile o fundătură? 0:13:51 – Oamenii învață prin imitație? 0:23:57 – Epoca experienței 0:34:25 – Arhitecturile actuale se generalizează slab în afara distribuției 0:42:17 – Surprize în domeniul AI 0:47:28 – Lecția amară se va aplica în continuare după AGI? 0:54:35 – Succesiunea la AI
Căutați Dwarkesh Podcast pe YouTube, Apple Podcasts, Spotify etc. pentru a viziona acolo și pentru a vă abona la episoadele viitoare.
1,38M