Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
DeepSeek uruchomił V3.2 Exp z nową architekturą DeepSeek Sparse Attention (DSA), która ma na celu zredukowanie wpływu kwadratowego skalowania obliczeń w zależności od długości kontekstu.
Niezależnie przetestowaliśmy V3.2 Exp, osiągając podobny poziom inteligencji do DeepSeek V3.1 Terminus; DeepSeek przeszedł na używanie V3.2 jako głównego punktu końcowego API i obniżył ceny API o ponad 50%. Dzięki zaktualizowanej cenie API pierwszej strony DeepSeek, koszt uruchomienia Indeksu Sztucznej Analizy Inteligencji spada z 114 USD do 41 USD.
DeepSeek twierdzi, że "celowo dostosował" konfiguracje treningowe V3.1 Terminus i V3.2 Exp. Dopasowanie wydajności V3.1 Terminus wydaje się wykazywać, że korzyści wydajnościowe architektury DeepSeek Spare Attention nie wpływają negatywnie na inteligencję.
Kluczowe wnioski z benchmarków:
➤🧠 Brak zmiany w zbiorczej inteligencji: W trybie rozumowania, DeepSeek V3.2 Exp uzyskuje wynik 57 w Indeksie Sztucznej Analizy Inteligencji. Uważamy to za równoważne inteligencji DeepSeek V3.1 Terminus (Rozumowanie)
➤📈 Brak spadku w rozumowaniu długiego kontekstu: Pomimo zmian w architekturze DeepSeek, V3.2 Exp (Rozumowanie) nie wydaje się wykazywać żadnego spadku w rozumowaniu długiego kontekstu - uzyskując niewielki wzrost w AA-LCR.
➤⚡ Wydajność nierozeznawcza: W trybie nierozeznawczym, DeepSeek V3.2 Exp nie wykazuje degradacji inteligencji, dorównując DeepSeek V3.1 Terminus z wynikiem 46 w Indeksie Sztucznej Analizy Inteligencji.
➤⚙️ Efektywność tokenów: Dla DeepSeek V3.2 Exp (Rozumowanie), zużycie tokenów do uruchomienia Indeksu Sztucznej Analizy Inteligencji nieznacznie spada z 67M do 62M w porównaniu do V3.1 Terminus. Zużycie tokenów pozostaje niezmienione dla wariantu nierozeznawczego.
➤💲Ceny: DeepSeek znacznie obniżył ceny za tokeny dla swojego API pierwszej strony z 0,56 USD/1,68 USD do 0,28 USD/0,42 USD za 1M tokenów wejściowych/wyjściowych - co stanowi redukcję cen o 50% i 75% odpowiednio dla tokenów wejściowych i wyjściowych.
Inne szczegóły modelu:
➤©️ Licencjonowanie: DeepSeek V3.2 Exp jest dostępny na licencji MIT.
➤🌐 Dostępność: DeepSeek V3.2 Exp jest dostępny za pośrednictwem API DeepSeek, które zastąpiło DeepSeek V3.1 Terminus. Użytkownicy mogą nadal uzyskiwać dostęp do DeepSeek V3.1 Terminus za pośrednictwem tymczasowego API DeepSeek do 15 października.
➤📏 Rozmiar: DeepSeek V3.2 Exp ma 671B całkowitych parametrów i 37B aktywnych parametrów. To samo, co wszystkie wcześniejsze modele w serii DeepSeek V3 i R1.

Porównaj, jak DeepSeek V3.2 Exp wypada w porównaniu do modeli, które używasz lub rozważasz na:
40,91K
Najlepsze
Ranking
Ulubione