DeepSeek telah meluncurkan V3.2 Exp dengan arsitektur DeepSeek Sparse Attention (DSA) baru mereka yang mengklaim dapat mengurangi dampak penskalaan kuadrat komputasi dengan panjang konteks Kami telah secara independen membandingkan V3.2 Exp sebagai pencapaian kecerdasan yang serupa dengan DeepSeek V3.1 Terminus; DeepSeek telah beralih menggunakan V3.2 untuk titik akhir API utama mereka dan telah mengurangi harga API sebesar >50%. Dengan harga API pihak pertama DeepSeek yang diperbarui, biaya untuk menjalankan Indeks Kecerdasan Analisis Buatan turun dari $114 menjadi $41. DeepSeek mengklaim telah "sengaja menyelaraskan" konfigurasi pelatihan V3.1 Terminus dan V3.2 Exp. Pencocokan kinerja V3.1 Kinerja Terminus tampaknya menunjukkan bahwa manfaat kinerja arsitektur DeepSeek Spare Attention tidak mengorbankan kecerdasan. Poin utama pembandingan: ➤ 🧠 Tidak ada perubahan dalam kecerdasan agregat: Dalam mode penalaran, DeepSeek V3.2 Exp mendapat skor 57 pada Indeks Kecerdasan Analisis Buatan. Kami melihat ini setara dalam kecerdasan dengan DeepSeek V3.1 Terminus (Penalaran) ➤ 📈 Tidak ada penurunan dalam penalaran konteks panjang: Terlepas dari perubahan arsitektur DeepSeek, V3.2 Exp (Penalaran) tampaknya tidak menunjukkan penurunan dalam penalaran konteks panjang - mencetak sedikit peningkatan dalam AA-LCR. ➤ ⚡ Performa non-penalaran: Dalam mode non-penalaran, DeepSeek V3.2 Exp tidak menunjukkan penurunan kecerdasan, cocok dengan DeepSeek V3.1 Terminus dengan skor 46 pada Indeks Kecerdasan Analisis Buatan ➤ ⚙️ Efisiensi token: Untuk DeepSeek V3.2 Exp (Reasoning), penggunaan token untuk menjalankan Indeks Kecerdasan Analisis Buatan sedikit menurun dari 67M menjadi 62M dibandingkan dengan V3.1 Terminus. Penggunaan token tetap tidak berubah untuk varian non-penalaran ➤💲Harga: DeepSeek telah secara signifikan mengurangi harga per token untuk API pihak pertama mereka dari $0,56/$1,68 menjadi $0,28/$0,42 per 1 juta token input/output - pengurangan masing-masing 50% dan 75% dalam harga token input dan output. Detail model lainnya: ➤ ©️ Lisensi: DeepSeek V3.2 Exp tersedia di bawah Lisensi MIT ➤ 🌐 Ketersediaan: DeepSeek V3.2 Exp tersedia melalui DeepSeek API, yang telah menggantikan DeepSeek V3.1 Terminus. Pengguna masih dapat mengakses DeepSeek V3.1 Terminus melalui API DeepSeek sementara hingga 15 Oktober ➤ 📏 Ukuran: DeepSeek V3.2 Exp memiliki 671B total parameter dan 37B parameter aktif. Ini sama dengan semua model sebelumnya dalam seri DeepSeek V3 dan R1
Bandingkan performa DeepSeek V3.2 Exp relatif terhadap model yang Anda gunakan atau pertimbangkan di:
40,28K