我刚刚听了关于Gemini从2.0跳到2.5的分析,以下是要点。 团队并没有仅仅依赖实验室测试。他们从X上收集了真实用户反馈,将那些“这个坏了”的时刻转化为实时评估,并在每次发布时不断添加新的边缘案例。 这是一个社区驱动的质量保证循环:我们的失败成为他们的基准,而这些基准又转化为我们的更好结果。 如果你是创作者或产品经理,这就是一个模板:公开反馈 → 评估 → 发布 → 重复。 干得好 @OfficialLoganK @nbrichtova 和整个团队。
60.67K