一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

再次未能理解指數增長？我與 @Mononofu - Julian Schrittwieser (@AnthropicAI, AlphaGo Zero, MuZero) 的對話，討論了第37步、擴展強化學習、AI的諾貝爾獎以及AI的前沿： 00:00 - 冷開場：“我們沒有看到任何放緩。” 00:32 - 介紹 — 認識Julian 01:09 - 前沿實驗室內的“指數” 04:46 - 2026–2027：全天工作的代理；專家級的廣度 08:58 - 基準與現實：長期工作、GDP-Val、用戶價值 10:26 - 第37步 — 實際發生了什麼以及為什麼重要 13:55 - 新穎的科學：AlphaCode/AlphaTensor → AI何時能獲得諾貝爾獎？ 16:25 - 不連續性與平滑進展（及警告信號） 19:08 - 預訓練 + RL 是否能讓我們達到目標？（AGI辯論不談） 20:55 - Sutton的“從零開始的RL”？Julian的看法 23:03 - Julian的路徑：Google → DeepMind → Anthropic 26:45 - AlphaGo（學習 + 搜索）用簡單的英語解釋 30:16 - AlphaGo Zero（無人類數據） ...