A IBM lançou o Granite 4.0 - uma nova família de modelos de linguagem de pesos abertos que variam em tamanho de 3B a 32B. A Análise Artificial recebeu acesso de pré-lançamento, e nosso benchmarking mostra o Granite 4.0 H Small (32B/9B total/parâmetros ativos) com um Índice de Inteligência de 23, com uma força particular na eficiência do token Hoje, a IBM lançou quatro novos modelos: Granite 4.0 H Small (32B/9B total/parâmetros ativos), Granite 4.0 H Tiny (7B/1B), Granite 4.0 H Micro (3B/3B) e Granite 4.0 Micro (3B/3B). Avaliamos o Granite 4.0 Small (no modo sem raciocínio) e o Granite 4.0 Micro usando o Índice de Inteligência de Análise Artificial. Os modelos Granite 4.0 combinam uma pequena quantidade de camadas de atenção padrão no estilo transformador com a maioria das camadas Mamba, o que afirma reduzir os requisitos de memória sem afetar o desempenho Principais conclusões de benchmarking: 🧠 ➤ Granite 4.0 H Small Intelligence: No não raciocínio, o Granite 4.0 H Small pontua 23 no índice de Inteligência de Análise Artificial - um salto de +8 pontos no Índice em comparação com o IBM Granite 3.3 8B (Non Reasoning). Granite 4.0 H Small fica à frente de Gemma 3 27B (22), mas atrás de Mistral Small 3.2 (29), EXAONE 4.0 32B (Não-Raciocínio, 30) e Qwen3 30B A3B 2507 (Não-Raciocínio, 37) em inteligência ⚡ ➤ Granite 4.0 Micro Intelligence: No Índice de Inteligência de Análise Artificial, o Granite 4.0 Micro pontua 16. Ele está à frente de Gemma 3 4B (15) e LFM 2 2.6B (12). ⚙️ ➤ Eficiência do token: Granite 4.0 H Small e Micro demonstram eficiência de token impressionante - Granite 4.0 Small usa 5,2 milhões, enquanto Granite 4.0 Micro usa 6,7 milhões de tokens para executar o Índice de Inteligência de Análise Artificial. Ambos os modelos têm menos tokens do que o Granite 3.3 8B (Non-Reasoning) e a maioria dos outros modelos de não raciocínio de pesos abertos menores que os parâmetros totais de 40B (exceto Qwen3 0.6B, que usa 1.9M de tokens de saída) Detalhes do modelo chave: 🌐 ➤ Disponibilidade: Todos os quatro modelos estão disponíveis no Hugging Face. O Granite 4.0 H Small está disponível no Replicate e custa US$ 0,06/US$ 0,25 por 1 milhão de tokens de entrada/saída 📏 ➤ Janela de contexto: 128 mil tokens ©️ ➤ Licenciamento: Os modelos Granite 4.0 estão disponíveis sob a licença Apache 2.0
A eficiência do token de saída do Granite 4.0 H Small (não racional) e o preço por token oferecem uma compensação atraente entre inteligência e Índice de Inteligência de Análise Artificial de Custo de Execução
Na categoria de modelos de não raciocínio de pesos abertos menores que os parâmetros totais de 40B, o Granite 4.0 H Small está na fronteira entre inteligência e tokens de saída usados no índice de inteligência de análise artificial
Na categoria de modelos de não raciocínio de pesos abertos menores que 4B parâmetros totais, o Granite 4.0 Micro está na fronteira do tradeoff entre inteligência e tokens de saída usados no índice de inteligência de análise artificial
Compare o desempenho dos modelos do Granite 4.0 em relação a outros modelos que você está usando ou considerando em:
32,63K