IBM uvedla na trh Granite 4.0 - novou rodinu jazykových modelů s otevřenými váhami o velikosti od 3B do 32B. Umělá analýza byla poskytnuta před vydáním a naše benchmarking ukazuje, že Granite 4.0 H Small (32B/9B celkových/aktivních parametrů) dosáhl indexu inteligence 23, se zvláštní silou v účinnosti tokenů Společnost IBM dnes představila čtyři nové modely: Granite 4.0 H Small (32B/9B celkové/aktivní parametry), Granite 4.0 H Tiny (7B/1B), Granite 4.0 H Micro (3B/3B) a Granite 4.0 Micro (3B/3B). Vyhodnotili jsme Granite 4.0 Small (v režimu nerozumu) a Granite 4.0 Micro pomocí indexu umělé analýzy. Modely Granite 4.0 kombinují malé množství standardních vrstev pozornosti ve stylu transformátoru s většinou vrstev Mamba, což tvrdí, že snižuje požadavky na paměť bez dopadu na výkon Klíčové poznatky z benchmarkingu: 🧠 ➤ Granite 4.0 H Small Intelligence: V nerozumovém má Granite 4.0 H Small skóre 23 v indexu umělé analýzy – skok o +8 bodů na indexu ve srovnání s IBM Granite 3.3 8B (bez uvažování). Granite 4.0 H Malý příčky před Gemmou 3 27B (22), ale za Mistral Small 3.2 (29), EXAONE 4.0 32B (Neuvažující, 30) a Qwen3 30B A3B 2507 (Neuvažující, 37) v inteligenci ⚡ ➤ Granite 4.0 Micro Intelligence: V indexu umělé analýzy má Granite 4.0 Micro skóre 16. Umístila se před Gemmou 3 4B (15) a LFM 2 2.6B (12). ⚙️ ➤ Účinnost tokenu: Granite 4.0 H Small a Micro vykazují působivou účinnost tokenů – Granite 4.0 Small využívá 5,2 milionu, zatímco Granite 4.0 Micro využívá 6,7 milionu tokenů ke spuštění indexu umělé analýzy. Oba modely mají méně tokenů než Granite 3.3 8B (Non-Reasoning) a většina ostatních modelů s otevřenou váhou menší než 40B celkových parametrů (kromě Qwen3 0.6B, která používá 1.9M výstupních tokenů) Klíčové detaily modelu: 🌐 ➤ Dostupnost: Všechny čtyři modely jsou k dispozici na Hugging Face. Granite 4.0 H Small je k dispozici na Replicate a jeho cena je 0,06 $/0,25 $ za 1 milion vstupních/výstupních tokenů 📏 ➤ Kontextové okno: 128 tisíc tokenů ©️ ➤ Licencování: Modely Granite 4.0 jsou k dispozici pod licencí Apache 2.0
Efektivita výstupního tokenu Granite 4.0 H Small (bez uvažování) a cena za token nabízí přesvědčivý kompromis mezi inteligencí a indexem umělé analýzy nákladů na provoz
V kategorii modelů s otevřenými váhami menšími než 40 miliard celkových parametrů je Granite 4.0 H Small na hranici kompromisu mezi inteligencí a výstupními tokeny používanými v indexu umělé analýzy
V kategorii modelů s otevřenými váhami menšími než celkové parametry 4B je Granite 4.0 Micro na hranici kompromisu mezi inteligencí a výstupními tokeny používanými v indexu umělé analýzy
Porovnejte, jak si modely Granite 4.0 vedou ve srovnání s jinými modely, které používáte nebo o kterých uvažujete:
32,64K