再次未能理解指数增长? 我与@Mononofu - Julian Schrittwieser(@AnthropicAI,AlphaGo Zero,MuZero)的对话 - 关于第37步、扩展强化学习、人工智能诺贝尔奖以及人工智能前沿: 00:00 - 冷开场:“我们没有看到任何放缓。” 00:32 - 介绍 — 认识Julian 01:09 - 前沿实验室内部的“指数” 04:46 - 2026–2027:全天工作的代理;专家级广度 08:58 - 基准与现实:长期工作,GDP-Val,用户价值 10:26 - 第37步 — 实际发生了什么以及为什么重要 13:55 - 新颖的科学:AlphaCode/AlphaTensor → 人工智能何时能获得诺贝尔奖? 16:25 - 不连续性与平滑进展(及警告信号) 19:08 - 预训练 + 强化学习能否让我们到达那里?(AGI辩论不谈) 20:55 - Sutton的“从零开始的强化学习”?Julian的看法 23:03 - Julian的路径:谷歌 → DeepMind → Anthropic 26:45 - AlphaGo(学习 + 搜索)用简单英语解释 30:16 - AlphaGo Zero(没有人类数据) ...