A DeepSeek lançou a V3.2 Exp com a sua nova arquitetura DeepSeek Sparse Attention (DSA), que afirma reduzir o impacto da escalabilidade quadrática do cálculo com o comprimento do contexto. Testámos de forma independente a V3.2 Exp, que alcançou uma inteligência semelhante à DeepSeek V3.1 Terminus; a DeepSeek passou a usar a V3.2 para o seu endpoint principal da API e reduziu os preços da API em mais de 50%. Com a atualização dos preços da API de primeira parte da DeepSeek, o custo para executar o Índice de Inteligência de Análise Artificial cai de $114 para $41. A DeepSeek afirma ter "alinhado deliberadamente" as configurações de treinamento da V3.1 Terminus e da V3.2 Exp. Igualar o desempenho da V3.1 Terminus parece demonstrar que os benefícios de desempenho da arquitetura DeepSeek Spare Attention não vêm à custa da inteligência. Principais conclusões dos benchmarks: ➤🧠  Sem alteração na inteligência agregada: No modo de raciocínio, a DeepSeek V3.2 Exp pontua 57 no Índice de Inteligência de Análise Artificial. Vemos isso como equivalente em inteligência à DeepSeek V3.1 Terminus (Raciocínio) ➤📈  Sem declínio no raciocínio de longo contexto: Apesar das mudanças na arquitetura da DeepSeek, a V3.2 Exp (Raciocínio) parece não apresentar qualquer declínio no raciocínio de longo contexto - pontuando um leve aumento no AA-LCR. ➤⚡ Desempenho não relacionado ao raciocínio: No modo não relacionado ao raciocínio, a DeepSeek V3.2 Exp não mostra degradação na inteligência, igualando a DeepSeek V3.1 Terminus com uma pontuação de 46 no Índice de Inteligência de Análise Artificial. ➤⚙️ Eficiência de tokens: Para a DeepSeek V3.2 Exp (Raciocínio), o uso de tokens para executar o Índice de Inteligência de Análise Artificial diminui ligeiramente de 67M para 62M em comparação com a V3.1 Terminus. O uso de tokens permanece inalterado para a variante não relacionada ao raciocínio. ➤💲Preços: A DeepSeek reduziu significativamente o preço por token para a sua API de primeira parte de $0.56/$1.68 para $0.28/$0.42 por 1M de tokens de entrada/saída - uma redução de 50% e 75% nos preços dos tokens de entrada e saída, respetivamente. Outros detalhes do modelo: ➤©️ Licenciamento: A DeepSeek V3.2 Exp está disponível sob a Licença MIT. ➤🌐 Disponibilidade: A DeepSeek V3.2 Exp está disponível via API DeepSeek, que substituiu a DeepSeek V3.1 Terminus. Os usuários ainda podem acessar a DeepSeek V3.1 Terminus através de uma API DeepSeek temporária até 15 de outubro. ➤📏 Tamanho: A DeepSeek V3.2 Exp tem 671B de parâmetros totais e 37B de parâmetros ativos. Isso é o mesmo que todos os modelos anteriores nas séries DeepSeek V3 e R1.
Compare como o DeepSeek V3.2 Exp se desempenha em relação aos modelos que está a usar ou a considerar em:
38,07K