A DeepSeek lançou o V3.2 Exp com sua nova arquitetura DeepSeek Sparse Attention (DSA) que afirma reduzir o impacto do dimensionamento quadrático da computação com comprimento de contexto Comparamos de forma independente o V3.2 Exp como alcançando inteligência semelhante ao DeepSeek V3.1 Terminus; A DeepSeek passou a usar a V3.2 para seu endpoint de API principal e reduziu o preço da API em >50%. Com os preços atualizados da API primária do DeepSeek, o custo para executar o Índice de Inteligência de Análise Artificial cai de US$ 114 para US$ 41. A DeepSeek afirma ter "alinhado deliberadamente" as configurações de treinamento da V3.1 Terminus e da V3.2 Exp. O desempenho da correspondência da V3.1 Terminus parece demonstrar que os benefícios de desempenho da arquitetura DeepSeek Spare Attention não têm um custo para a inteligência. Principais conclusões de benchmarking: 🧠 ➤ Nenhuma alteração na inteligência agregada: No modo de raciocínio, o DeepSeek V3.2 Exp pontua 57 no Índice de Inteligência de Análise Artificial. Vemos isso como equivalente em inteligência ao DeepSeek V3.1 Terminus (Raciocínio) 📈 ➤ Nenhum declínio no raciocínio de contexto longo: Apesar das mudanças de arquitetura do DeepSeek, o V3.2 Exp (Reasoning) parece não exibir nenhum declínio no raciocínio de contexto longo - marcando um ligeiro aumento no AA-LCR. ⚡ ➤ Desempenho sem raciocínio: No modo sem raciocínio, o DeepSeek V3.2 Exp não mostra degradação na inteligência, igualando o DeepSeek V3.1 Terminus com uma pontuação de 46 no Índice de Inteligência de Análise Artificial ⚙️ ➤ Eficiência do token: Para o DeepSeek V3.2 Exp (Raciocínio), o uso do token para executar o Índice de Inteligência de Análise Artificial diminui ligeiramente de 67 milhões para 62 milhões em comparação com o V3.1 Terminus. O uso de token permanece inalterado para a variante sem raciocínio ➤💲Preços: A DeepSeek reduziu significativamente o preço por token para sua API primária de US$ 0,56/US$ 1,68 para US$ 0,28/US$ 0,42 por 1 milhão de tokens de entrada/saída - uma redução de 50% e 75% no preço dos tokens de entrada e saída, respectivamente. Outros detalhes do modelo: ©️ ➤ Licenciamento: O DeepSeek V3.2 Exp está disponível sob a licença MIT 🌐 ➤ Disponibilidade: O DeepSeek V3.2 Exp está disponível via API DeepSeek, que substituiu o DeepSeek V3.1 Terminus. Os usuários ainda podem acessar o DeepSeek V3.1 Terminus por meio de uma API temporária do DeepSeek até 15 de outubro 📏 ➤ Tamanho: O DeepSeek V3.2 Exp possui 671B de parâmetros totais e 37B de parâmetros ativos. Isso é o mesmo que todos os modelos anteriores das séries DeepSeek V3 e R1
Compare o desempenho do DeepSeek V3.2 Exp em relação aos modelos que você está usando ou considerando em:
40,29K