Keadaan model DeepSeek: DeepSeek meluncurkan model penalaran hibrida V3.1 Terminus dan V3.2 Exp barunya secara berturut-turut pada bulan September, membuat langkah yang berarti dalam kecerdasan dan efisiensi biaya Kedua model dapat digunakan dalam mode penalaran dan non-penalaran, dan dimaksudkan untuk menggantikan model V3 dan R1 sebelumnya. DeepSeek V3.1 Terminus melonjak 4 poin lebih tinggi pada Indeks Kecerdasan Analisis Buatan daripada rilis V3.1 asli tanpa lebih banyak token, dan V3.2 Experimental mempertahankan sebagian besar keuntungan ini sekaligus secara substansial mengurangi biaya per token karena arsitektur baru eksperimental DeepSeek. DeepSeek V3.1 Terminus dan V3.2 Exp memiliki skor yang sama dalam Analisis Buatan, dengan V3.1 Terminus berada satu poin di atas V3.2 Exp. Keduanya merupakan peningkatan material dari model V3 dan R1 sebelumnya. Berbagai penyedia melayani kedua model, dengan ketersediaan V3.2 masih berkembang: ➤ DeepSeek V3.1 Terminus tersedia di SambaNova, DeepInfra, Fireworks, GMI, dan Novita, dengan @SambaNovaAI menawarkan kecepatan keluaran ~250 token per detik (sekitar 10x lebih cepat daripada inferensi pihak pertama DeepSeek) ➤ DeepSeek V3.2 Exp tersedia di API pihak pertama DeepSeek, DeepInfra, GMI, dan Novita - dengan DeepInfra menyajikannya tercepat dengan kecepatan hingga 79 token per detik
Lihat di bawah ini untuk perbandingan penyedia kami untuk kedua model DeepSeek baru ini:
20,18K