再次未能理解指數增長? 我與 @Mononofu - Julian Schrittwieser (@AnthropicAI, AlphaGo Zero, MuZero) 的對話,討論了第37步、擴展強化學習、AI的諾貝爾獎以及AI的前沿: 00:00 - 冷開場:“我們沒有看到任何放緩。” 00:32 - 介紹 — 認識Julian 01:09 - 前沿實驗室內的“指數” 04:46 - 2026–2027:全天工作的代理;專家級的廣度 08:58 - 基準與現實:長期工作、GDP-Val、用戶價值 10:26 - 第37步 — 實際發生了什麼以及為什麼重要 13:55 - 新穎的科學:AlphaCode/AlphaTensor → AI何時能獲得諾貝爾獎? 16:25 - 不連續性與平滑進展(及警告信號) 19:08 - 預訓練 + RL 是否能讓我們達到目標?(AGI辯論不談) 20:55 - Sutton的“從零開始的RL”?Julian的看法 23:03 - Julian的路徑:Google → DeepMind → Anthropic 26:45 - AlphaGo(學習 + 搜索)用簡單的英語解釋 30:16 - AlphaGo Zero(無人類數據) ...