DeepSeek ha lanciato V3.2 Exp con la loro nuova architettura DeepSeek Sparse Attention (DSA) che afferma di ridurre l'impatto della scalabilità quadratica del calcolo con la lunghezza del contesto Abbiamo valutato in modo indipendente V3.2 Exp come raggiungente un'intelligenza simile a DeepSeek V3.1 Terminus; DeepSeek ha iniziato a utilizzare V3.2 per il loro endpoint API principale e ha ridotto i prezzi API di oltre il 50%. Con i prezzi aggiornati dell'API di prima parte di DeepSeek, il costo per eseguire l'Artificial Analysis Intelligence Index scende da $114 a $41. DeepSeek afferma di aver "allineato deliberatamente" le configurazioni di addestramento di V3.1 Terminus e V3.2 Exp. Abbinare le prestazioni di V3.1 Terminus sembra dimostrare che i benefici delle prestazioni dell'architettura DeepSeek Spare Attention non comportano un costo per l'intelligenza. Punti chiave dei benchmark: ➤🧠  Nessun cambiamento nell'intelligenza aggregata: In modalità ragionamento, DeepSeek V3.2 Exp ottiene 57 sull'Artificial Analysis Intelligence Index. Vediamo questo come equivalente in intelligenza a DeepSeek V3.1 Terminus (Ragionamento) ➤📈 Nessun calo nel ragionamento a lungo termine: Nonostante i cambiamenti architettonici di DeepSeek, V3.2 Exp (Ragionamento) sembra non mostrare alcun calo nel ragionamento a lungo termine - ottenendo un leggero aumento in AA-LCR. ➤⚡ Prestazioni non di ragionamento: In modalità non di ragionamento, DeepSeek V3.2 Exp non mostra degradazione nell'intelligenza, abbinando DeepSeek V3.1 Terminus con un punteggio di 46 sull'Artificial Analysis Intelligence Index ➤⚙️ Efficienza dei token: Per DeepSeek V3.2 Exp (Ragionamento), l'uso dei token per eseguire l'Artificial Analysis Intelligence Index diminuisce leggermente da 67M a 62M rispetto a V3.1 Terminus. L'uso dei token rimane invariato per la variante non di ragionamento ➤💲Prezzi: DeepSeek ha ridotto significativamente il prezzo per token per la loro API di prima parte da $0.56/$1.68 a $0.28/$0.42 per 1M di token di input/output - una riduzione del 50% e del 75% nei prezzi dei token di input e output rispettivamente. Altri dettagli del modello: ➤©️ Licenza: DeepSeek V3.2 Exp è disponibile sotto la Licenza MIT ➤🌐 Disponibilità: DeepSeek V3.2 Exp è disponibile tramite l'API DeepSeek, che ha sostituito DeepSeek V3.1 Terminus. Gli utenti possono ancora accedere a DeepSeek V3.1 Terminus tramite un'API DeepSeek temporanea fino al 15 ottobre ➤📏 Dimensione: DeepSeek V3.2 Exp ha 671B di parametri totali e 37B di parametri attivi. Questo è lo stesso di tutti i modelli precedenti nella serie DeepSeek V3 e R1.
Confronta come si comporta DeepSeek V3.2 Exp rispetto ai modelli che stai utilizzando o considerando a:
40,29K