DeepSeek 已推出 V3.2 Exp,採用其新的 DeepSeek Sparse Attention (DSA) 架構,聲稱能減少計算隨上下文長度的平方擴展影響。 我們獨立基準測試 V3.2 Exp,發現其智能水平與 DeepSeek V3.1 Terminus 相似;DeepSeek 已轉向使用 V3.2 作為其主要 API 端點,並將 API 價格降低了超過 50%。隨著 DeepSeek 更新的第一方 API 價格,運行人工分析智能指數的成本從 $114 降至 $41。 DeepSeek 聲稱已“故意對齊” V3.1 Terminus 和 V3.2 Exp 的訓練配置。匹配 V3.1 Terminus 的性能似乎表明,DeepSeek Sparse Attention 架構的性能優勢並不以智能為代價。 關鍵基準測試要點: ➤🧠  整體智能無變化:在推理模式下,DeepSeek V3.2 Exp 在人工分析智能指數上得分 57。我們認為這與 DeepSeek V3.1 Terminus (推理) 的智能水平相當。 ➤📈  長上下文推理無下降:儘管 DeepSeek 的架構發生了變化,V3.2 Exp (推理) 似乎在長上下文推理上沒有顯示出任何下降 - 在 AA-LCR 上得分略有提升。 ➤⚡ 非推理性能:在非推理模式下,DeepSeek V3.2 Exp 在智能上沒有退化,與 DeepSeek V3.1 Terminus 在人工分析智能指數上得分 46 相匹配。 ➤⚙️ 令牌效率:對於 DeepSeek V3.2 Exp (推理),運行人工分析智能指數的令牌使用量從 V3.1 Terminus 的 67M 輕微減少至 62M。非推理變體的令牌使用量保持不變。 ➤💲 價格:DeepSeek 顯著降低了其第一方 API 的每令牌價格,從 $0.56/$1.68 降至每 1M 輸入/輸出令牌的 $0.28/$0.42 - 分別降低了 50% 和 75% 的輸入和輸出令牌價格。 其他模型詳情: ➤©️  授權:DeepSeek V3.2 Exp 在 MIT 許可下提供。 ➤🌐  可用性:DeepSeek V3.2 Exp 可通過 DeepSeek API 獲得,該 API 已取代 DeepSeek V3.1 Terminus。用戶仍然可以通過臨時 DeepSeek API 訪問 DeepSeek V3.1 Terminus,直到 10 月 15 日。 ➤📏  大小:DeepSeek V3.2 Exp 擁有 671B 總參數和 37B 活躍參數。這與 DeepSeek V3 和 R1 系列的所有先前模型相同。
比較 DeepSeek V3.2 Exp 的表現與您正在使用或考慮的模型:
38.06K