DeepSeek a lansat V3.2 Exp cu noua lor arhitectură DeepSeek Sparse Attention (DSA) care pretinde că reduce impactul scalării pătratice a calculului cu lungimea contextului Am evaluat în mod independent V3.2 Exp ca obținând o inteligență similară cu DeepSeek V3.1 Terminus; DeepSeek a trecut la utilizarea V3.2 pentru endpoint-ul principal API și a redus prețurile API cu >50%. Cu prețurile actualizate ale API-ului primar de la DeepSeek, costul de rulare a indicelui de inteligență de analiză artificială scade de la 114 USD la 41 USD. DeepSeek pretinde că a "aliniat în mod deliberat" configurațiile de antrenament ale V3.1 Terminus și V3.2 Exp. Potrivirea V3.1 Performanța Terminus pare să demonstreze că beneficiile de performanță ale arhitecturii DeepSeek Spare Attention nu vin cu un cost pentru inteligență. Principalele concluzii ale analizei comparative: ➤ 🧠 Nicio schimbare în inteligența agregată: În modul de raționament, DeepSeek V3.2 Exp obține 57 la Artificial Analysis Intelligence Index. Vedem acest lucru ca fiind echivalent în inteligență cu DeepSeek V3.1 Terminus (Raționament) ➤ 📈 Nicio scădere a raționamentului de context lung: În ciuda modificărilor de arhitectură ale DeepSeek, V3.2 Exp (Reasoning) pare să nu prezinte niciun declin în raționamentul de context lung - obținând o ușoară creștere în AA-LCR. ➤ ⚡ Performanță non-raționament: În modul non-raționament, DeepSeek V3.2 Exp nu arată nicio degradare a inteligenței, potrivindu-se cu DeepSeek V3.1 Terminus cu un scor de 46 la Artificial Analysis Intelligence Index ➤ ⚙️ Eficiența tokenului: Pentru DeepSeek V3.2 Exp (Reasoning), utilizarea tokenului pentru a rula Artificial Analysis Intelligence Index scade ușor de la 67M la 62M în comparație cu V3.1 Terminus. Utilizarea tokenului rămâne neschimbată pentru varianta fără raționament ➤💲Prețuri: DeepSeek a redus semnificativ prețul per token pentru API-ul lor primar de la 0,56 USD/1,68 USD la 0,28 USD/0,42 USD per 1 milion de tokenuri de intrare/ieșire - o reducere de 50% și, respectiv, 75% a prețurilor tokenurilor de intrare și, respectiv, ieșire. Alte detalii despre model: ➤ ©️ Licențiere: DeepSeek V3.2 Exp este disponibil sub licența MIT ➤ 🌐 Disponibilitate: DeepSeek V3.2 Exp este disponibil prin API-ul DeepSeek, care a înlocuit DeepSeek V3.1 Terminus. Utilizatorii pot accesa în continuare DeepSeek V3.1 Terminus printr-un API DeepSeek temporar până pe 15 octombrie ➤ 📏 Dimensiune: DeepSeek V3.2 Exp are 671B parametri totali și 37B parametri activi. Acest lucru este la fel ca toate modelele anterioare din seriile DeepSeek V3 și R1
Comparați performanța DeepSeek V3.2 Exp în raport cu modelele pe care le utilizați sau pe care le luați în considerare la:
40,93K