DeepSeek は、コンテキスト長によるコンピューティングの 2 次スケーリングの影響を軽減すると主張する新しい DeepSeek Sparse Attention (DSA) アーキテクチャを備えた V3.2 Exp をリリースしました 私たちは、DeepSeek V3.1 Terminus と同様のインテリジェンスを実現しているとして、V3.2 Exp を独自にベンチマークしました。DeepSeek は、メインの API エンドポイントに V3.2 の使用に切り替え、API 価格を >50% 引き下げました。DeepSeek の最新のファーストパーティ API 価格により、人工分析知能インデックスの実行コストは 114 ドルから 41 ドルに下がります。 DeepSeekは、V3.1 TerminusとV3.2 Expのトレーニング構成を「意図的に調整」したと主張しています。Matching V3.1 Terminusのパフォーマンスは、DeepSeek Spare Attentionアーキテクチャのパフォーマンス上の利点がインテリジェンスを犠牲にしないことを示しているようです。 ベンチマークの主なポイント: ➤ 🧠 集計知能に変化なし: 推論モードでは、DeepSeek V3.2 Exp は人工分析知能指数で 57 のスコアを獲得しています。これは、DeepSeek V3.1 Terminus (Reasoning) と同等のインテリジェンスであると考えています。 ➤ 📈 ロングコンテキスト推論の低下なし: DeepSeek のアーキテクチャの変更にもかかわらず、V3.2 Exp (推論) はロングコンテキスト推論の低下を示さないようで、AA-LCR がわずかに向上しました。 ➤ ⚡ 非推論パフォーマンス: 非推論モードでは、DeepSeek V3.2 Exp は知能の低下を示さず、DeepSeek V3.1 Terminus と人工分析知能指数のスコア 46 に匹敵します。 ➤ ⚙️ トークン効率: DeepSeek V3.2 Exp (Reasoning) の場合、人工分析知能インデックスを実行するためのトークン使用量は、V3.1 Terminus と比較して 67M から 62M にわずかに減少します。トークンの使用法は、非推論バリアントでは変更されません ➤💲価格: DeepSeek は、ファーストパーティ API のトークンごとの価格を 0.56 ドル/1.68 ドルから 0.28M 入力/出力トークンあたり 0.28 ドル/0.42 ドルに大幅に引き下げ、入力トークンと出力トークンの価格がそれぞれ 50% と 75% 引き下げられました。 その他のモデルの詳細: ➤ ©️ ライセンス: DeepSeek V3.2 Exp は MIT ライセンスの下で利用できます ➤ 🌐 可用性: DeepSeek V3.2 Exp は、DeepSeek V3.1 Terminus に取って代わる DeepSeek API を介して利用できます。ユーザーは、10月15日まで、一時的なDeepSeek APIを介してDeepSeek V3.1 Terminusにアクセスできます ➤📏サイズ:DeepSeek V3.2 Expには、合計671Bのパラメータと37Bのアクティブパラメータがあります。これは、DeepSeek V3 および R1 シリーズの以前のすべてのモデルと同じです
DeepSeek V3.2 Exp のパフォーマンスを、使用中または検討中のモデルと比較してください。
40.28K