IBM a lancé Granite 4.0 - une nouvelle famille de modèles de langage à poids ouverts allant de 3B à 32B. Artificial Analysis a eu accès à la version préliminaire, et nos tests montrent que Granite 4.0 H Small (32B/9B paramètres totaux/actifs) obtient un indice d'intelligence de 23, avec une force particulière en efficacité des tokens. Aujourd'hui, IBM a publié quatre nouveaux modèles : Granite 4.0 H Small (32B/9B paramètres totaux/actifs), Granite 4.0 H Tiny (7B/1B), Granite 4.0 H Micro (3B/3B) et Granite 4.0 Micro (3B/3B). Nous avons évalué Granite 4.0 Small (en mode non-raisonnement) et Granite 4.0 Micro en utilisant l'indice d'intelligence d'Artificial Analysis. Les modèles Granite 4.0 combinent une petite quantité de couches d'attention de style transformateur standard avec une majorité de couches Mamba qui prétendent réduire les exigences en mémoire sans impacter les performances. Principaux enseignements des tests : ➤🧠 Intelligence de Granite 4.0 H Small : En mode non-raisonnement, Granite 4.0 H Small obtient 23 sur l'indice d'intelligence d'Artificial Analysis - une augmentation de +8 points par rapport à IBM Granite 3.3 8B (Non-Raisonnement). Granite 4.0 H Small se classe devant Gemma 3 27B (22) mais derrière Mistral Small 3.2 (29), EXAONE 4.0 32B (Non-Raisonnement, 30) et Qwen3 30B A3B 2507 (Non-Raisonnement, 37) en intelligence. ➤⚡ Intelligence de Granite 4.0 Micro : Sur l'indice d'intelligence d'Artificial Analysis, Granite 4.0 Micro obtient 16. Il se classe devant Gemma 3 4B (15) et LFM 2 2.6B (12). ➤⚙️ Efficacité des tokens : Granite 4.0 H Small et Micro démontrent une efficacité des tokens impressionnante - Granite 4.0 Small utilise 5.2M, tandis que Granite 4.0 Micro utilise 6.7M de tokens pour exécuter l'indice d'intelligence d'Artificial Analysis. Les deux modèles utilisent moins de tokens que Granite 3.3 8B (Non-Raisonnement) et la plupart des autres modèles à poids ouverts en mode non-raisonnement de moins de 40B de paramètres totaux (sauf Qwen3 0.6B qui utilise 1.9M de tokens de sortie). Détails clés des modèles : ➤🌐 Disponibilité : Les quatre modèles sont disponibles sur Hugging Face. Granite 4.0 H Small est disponible sur Replicate et est tarifé à 0,06 $/0,25 $ par 1M de tokens d'entrée/sortie. ➤📏 Fenêtre de contexte : 128K tokens. ➤©️ Licence : Les modèles Granite 4.0 sont disponibles sous la licence Apache 2.0.
L'efficacité des tokens de sortie et le prix par token de Granite 4.0 H Small (Non Reasoning) offrent un compromis convaincant entre l'intelligence et le coût de fonctionnement de l'Index d'Analyse d'Intelligence Artificielle.
Dans la catégorie des modèles Open Weights Non-Reasoning de moins de 40 milliards de paramètres au total, Granite 4.0 H Small se situe à la frontière du compromis entre l'intelligence et les Tokens de Sortie Utilisés dans l'Indice d'Intelligence d'Analyse Artificielle.
Dans la catégorie des modèles Non-Raisonnement à Poids Ouverts de moins de 4 milliards de paramètres au total, Granite 4.0 Micro est à la pointe du compromis entre intelligence et Tokens de Sortie Utilisés dans l'Indice d'Intelligence d'Analyse Artificielle.
Comparez les performances des modèles Granite 4.0 par rapport aux autres modèles que vous utilisez ou envisagez à :
34,3K