一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

DeepSeek 已推出 V3.2 Exp，采用其新的 DeepSeek 稀疏注意力 (DSA) 架构，声称可以减少计算在上下文长度上的平方扩展影响。我们独立基准测试了 V3.2 Exp，发现其智能水平与 DeepSeek V3.1 Terminus 相似；DeepSeek 已切换到使用 V3.2 作为其主要 API 端点，并将 API 定价降低了超过 50%。随着 DeepSeek 更新的第一方 API 定价，运行人工分析智能指数的成本从 $114 降至 $41。 DeepSeek 声称已“故意对齐” V3.1 Terminus 和 V3.2 Exp 的训练配置。与 V3.1 Terminus 的性能匹配似乎表明，DeepSeek 稀疏注意力架构的性能优势并未以牺牲智能为代价。关键基准测试要点： ➤🧠 总体智能没有变化：在推理模式下，DeepSeek V3.2 Exp 在人工分析智能指数上得分 57。我们认为这与 DeepSeek V3.1 Terminus（推理）的智能水平相当。 ➤📈 长上下文推理没有下降：尽管 DeepSeek 的架构发生了变化，V3.2 Exp（推理）似乎在长上下文推理上没有表现出任何下降 - 在 AA-LCR 上得分略有提升。 ➤⚡ 非推理性能：在非推理模式下，DeepSeek V3.2 Exp 在智能上没有退化，得分 46，与 DeepSeek V3.1 Terminus 相匹配，均在人工分析智能指数上得分。 ➤⚙️ 令牌效率：对于 DeepSeek V3.2 Exp（推理），运行人工分析智能指数的令牌使用量从 V3.1 Terminus 的 67M 稍微减少到 62M。非推理变体的令牌使用量保持不变。 ➤💲 定价：DeepSeek 已显著降低其第一方 API 的每个令牌定价，从 $0.56/$1.68 降至 $0.28/$0.42 每 1M 输入/输出令牌 - 输入和输出令牌的定价分别降低了 50% 和 75%。其他模型细节： ➤©️ 许可：DeepSeek V3.2 Exp 在 MIT 许可证下提供。 ➤🌐 可用性：DeepSeek V3.2 Exp 通过 DeepSeek API 提供，已替代 DeepSeek V3.1 Terminus。用户仍可以通过临时 DeepSeek API 访问 DeepSeek V3.1 Terminus，直到 10 月 15 日。 ➤📏 大小：DeepSeek V3.2 Exp 具有 671B 的总参数和 37B 的活跃参数。这与 DeepSeek V3 和 R1 系列的所有先前模型相同。

比较一下 DeepSeek V3.2 Exp 相对于您正在使用或考虑的模型的表现：

38.06K