Estado dos modelos DeepSeek: A DeepSeek lançou os seus novos modelos de raciocínio híbrido V3.1 Terminus e V3.2 Exp em rápida sucessão em setembro, dando passos significativos tanto em inteligência quanto em eficiência de custos. Ambos os modelos podem ser usados em modos de raciocínio e não raciocínio, e são destinados a substituir os modelos anteriores V3 e R1. O DeepSeek V3.1 Terminus subiu 4 pontos a mais no Índice de Inteligência de Análise Artificial do que o lançamento original do V3.1, sem substancialmente mais tokens, e o V3.2 Experimental manteve a maior parte desses ganhos enquanto reduzia substancialmente os custos por token devido à nova arquitetura experimental da DeepSeek. O DeepSeek V3.1 Terminus e o V3.2 Exp pontuam de forma semelhante em Análise Artificial, com o V3.1 Terminus ficando um ponto acima do V3.2 Exp. Ambos são atualizações materiais em relação aos modelos anteriores V3 e R1. Uma variedade de provedores está servindo ambos os modelos, com a disponibilidade do V3.2 ainda se expandindo: ➤ O DeepSeek V3.1 Terminus está disponível na SambaNova, DeepInfra, Fireworks, GMI e Novita, com @SambaNovaAI oferecendo velocidades de saída de ~250 tokens por segundo (cerca de 10x mais rápido do que a inferência de primeira parte da DeepSeek). ➤ O DeepSeek V3.2 Exp está disponível na API de primeira parte da DeepSeek, DeepInfra, GMI e Novita - com a DeepInfra servindo-o mais rapidamente a velocidades de até 79 tokens por segundo.
Veja abaixo a nossa comparação de fornecedores para ambos os novos modelos DeepSeek:
20,25K