热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
DeepSeek 已推出 V3.2 Exp,采用其新的 DeepSeek 稀疏注意力 (DSA) 架构,声称可以减少计算在上下文长度上的平方扩展影响。
我们独立基准测试了 V3.2 Exp,发现其智能水平与 DeepSeek V3.1 Terminus 相似;DeepSeek 已切换到使用 V3.2 作为其主要 API 端点,并将 API 定价降低了超过 50%。随着 DeepSeek 更新的第一方 API 定价,运行人工分析智能指数的成本从 $114 降至 $41。
DeepSeek 声称已“故意对齐” V3.1 Terminus 和 V3.2 Exp 的训练配置。与 V3.1 Terminus 的性能匹配似乎表明,DeepSeek 稀疏注意力架构的性能优势并未以牺牲智能为代价。
关键基准测试要点:
➤🧠 总体智能没有变化:在推理模式下,DeepSeek V3.2 Exp 在人工分析智能指数上得分 57。我们认为这与 DeepSeek V3.1 Terminus(推理)的智能水平相当。
➤📈 长上下文推理没有下降:尽管 DeepSeek 的架构发生了变化,V3.2 Exp(推理)似乎在长上下文推理上没有表现出任何下降 - 在 AA-LCR 上得分略有提升。
➤⚡ 非推理性能:在非推理模式下,DeepSeek V3.2 Exp 在智能上没有退化,得分 46,与 DeepSeek V3.1 Terminus 相匹配,均在人工分析智能指数上得分。
➤⚙️ 令牌效率:对于 DeepSeek V3.2 Exp(推理),运行人工分析智能指数的令牌使用量从 V3.1 Terminus 的 67M 稍微减少到 62M。非推理变体的令牌使用量保持不变。
➤💲 定价:DeepSeek 已显著降低其第一方 API 的每个令牌定价,从 $0.56/$1.68 降至 $0.28/$0.42 每 1M 输入/输出令牌 - 输入和输出令牌的定价分别降低了 50% 和 75%。
其他模型细节:
➤©️ 许可:DeepSeek V3.2 Exp 在 MIT 许可证下提供。
➤🌐 可用性:DeepSeek V3.2 Exp 通过 DeepSeek API 提供,已替代 DeepSeek V3.1 Terminus。用户仍可以通过临时 DeepSeek API 访问 DeepSeek V3.1 Terminus,直到 10 月 15 日。
➤📏 大小:DeepSeek V3.2 Exp 具有 671B 的总参数和 37B 的活跃参数。这与 DeepSeek V3 和 R1 系列的所有先前模型相同。

比较一下 DeepSeek V3.2 Exp 相对于您正在使用或考虑的模型的表现:
38.06K
热门
排行
收藏