Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
A DeepSeek lançou a V3.2 Exp com a sua nova arquitetura DeepSeek Sparse Attention (DSA), que afirma reduzir o impacto da escalabilidade quadrática do cálculo com o comprimento do contexto.
Testámos de forma independente a V3.2 Exp, que alcançou uma inteligência semelhante à DeepSeek V3.1 Terminus; a DeepSeek passou a usar a V3.2 para o seu endpoint principal da API e reduziu os preços da API em mais de 50%. Com a atualização dos preços da API de primeira parte da DeepSeek, o custo para executar o Índice de Inteligência de Análise Artificial cai de $114 para $41.
A DeepSeek afirma ter "alinhado deliberadamente" as configurações de treinamento da V3.1 Terminus e da V3.2 Exp. Igualar o desempenho da V3.1 Terminus parece demonstrar que os benefícios de desempenho da arquitetura DeepSeek Spare Attention não vêm à custa da inteligência.
Principais conclusões dos benchmarks:
➤🧠 Sem alteração na inteligência agregada: No modo de raciocínio, a DeepSeek V3.2 Exp pontua 57 no Índice de Inteligência de Análise Artificial. Vemos isso como equivalente em inteligência à DeepSeek V3.1 Terminus (Raciocínio)
➤📈 Sem declínio no raciocínio de longo contexto: Apesar das mudanças na arquitetura da DeepSeek, a V3.2 Exp (Raciocínio) parece não apresentar qualquer declínio no raciocínio de longo contexto - pontuando um leve aumento no AA-LCR.
➤⚡ Desempenho não relacionado ao raciocínio: No modo não relacionado ao raciocínio, a DeepSeek V3.2 Exp não mostra degradação na inteligência, igualando a DeepSeek V3.1 Terminus com uma pontuação de 46 no Índice de Inteligência de Análise Artificial.
➤⚙️ Eficiência de tokens: Para a DeepSeek V3.2 Exp (Raciocínio), o uso de tokens para executar o Índice de Inteligência de Análise Artificial diminui ligeiramente de 67M para 62M em comparação com a V3.1 Terminus. O uso de tokens permanece inalterado para a variante não relacionada ao raciocínio.
➤💲Preços: A DeepSeek reduziu significativamente o preço por token para a sua API de primeira parte de $0.56/$1.68 para $0.28/$0.42 por 1M de tokens de entrada/saída - uma redução de 50% e 75% nos preços dos tokens de entrada e saída, respetivamente.
Outros detalhes do modelo:
➤©️ Licenciamento: A DeepSeek V3.2 Exp está disponível sob a Licença MIT.
➤🌐 Disponibilidade: A DeepSeek V3.2 Exp está disponível via API DeepSeek, que substituiu a DeepSeek V3.1 Terminus. Os usuários ainda podem acessar a DeepSeek V3.1 Terminus através de uma API DeepSeek temporária até 15 de outubro.
➤📏 Tamanho: A DeepSeek V3.2 Exp tem 671B de parâmetros totais e 37B de parâmetros ativos. Isso é o mesmo que todos os modelos anteriores nas séries DeepSeek V3 e R1.

Compare como o DeepSeek V3.2 Exp se desempenha em relação aos modelos que está a usar ou a considerar em:
38,07K
Top
Classificação
Favoritos