Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Artificial Analysis
Nezávislá analýza modelů AI a poskytovatelů hostingu - vyberte si nejlepší model a poskytovatele API pro váš případ použití
IBM uvedla na trh Granite 4.0 - novou rodinu jazykových modelů s otevřenými váhami o velikosti od 3B do 32B. Umělá analýza byla poskytnuta před vydáním a naše benchmarking ukazuje, že Granite 4.0 H Small (32B/9B celkových/aktivních parametrů) dosáhl indexu inteligence 23, se zvláštní silou v účinnosti tokenů
Společnost IBM dnes představila čtyři nové modely: Granite 4.0 H Small (32B/9B celkové/aktivní parametry), Granite 4.0 H Tiny (7B/1B), Granite 4.0 H Micro (3B/3B) a Granite 4.0 Micro (3B/3B). Vyhodnotili jsme Granite 4.0 Small (v režimu nerozumu) a Granite 4.0 Micro pomocí indexu umělé analýzy. Modely Granite 4.0 kombinují malé množství standardních vrstev pozornosti ve stylu transformátoru s většinou vrstev Mamba, což tvrdí, že snižuje požadavky na paměť bez dopadu na výkon
Klíčové poznatky z benchmarkingu:
🧠 ➤ Granite 4.0 H Small Intelligence: V nerozumovém má Granite 4.0 H Small skóre 23 v indexu umělé analýzy – skok o +8 bodů na indexu ve srovnání s IBM Granite 3.3 8B (bez uvažování). Granite 4.0 H Malý příčky před Gemmou 3 27B (22), ale za Mistral Small 3.2 (29), EXAONE 4.0 32B (Neuvažující, 30) a Qwen3 30B A3B 2507 (Neuvažující, 37) v inteligenci
⚡ ➤ Granite 4.0 Micro Intelligence: V indexu umělé analýzy má Granite 4.0 Micro skóre 16. Umístila se před Gemmou 3 4B (15) a LFM 2 2.6B (12).
⚙️ ➤ Účinnost tokenu: Granite 4.0 H Small a Micro vykazují působivou účinnost tokenů – Granite 4.0 Small využívá 5,2 milionu, zatímco Granite 4.0 Micro využívá 6,7 milionu tokenů ke spuštění indexu umělé analýzy. Oba modely mají méně tokenů než Granite 3.3 8B (Non-Reasoning) a většina ostatních modelů s otevřenou váhou menší než 40B celkových parametrů (kromě Qwen3 0.6B, která používá 1.9M výstupních tokenů)
Klíčové detaily modelu:
🌐 ➤ Dostupnost: Všechny čtyři modely jsou k dispozici na Hugging Face. Granite 4.0 H Small je k dispozici na Replicate a jeho cena je 0,06 $/0,25 $ za 1 milion vstupních/výstupních tokenů
📏 ➤ Kontextové okno: 128 tisíc tokenů
©️ ➤ Licencování: Modely Granite 4.0 jsou k dispozici pod licencí Apache 2.0


34,3K
Společnost DeepSeek uvedla na trh V3.2 Exp se svou novou architekturou DeepSeek Sparse Attention (DSA), která tvrdí, že snižuje dopad kvadratického škálování výpočtů s délkou kontextu
Nezávisle jsme porovnali V3.2 Exp jako dosažení podobné inteligence jako DeepSeek V3.1 Terminus; Společnost DeepSeek přešla na používání verze 3.2 pro svůj hlavní koncový bod API a snížila ceny API o >50 %. Díky aktualizovaným cenám API první strany DeepSeek klesají náklady na provoz indexu umělé analýzy ze 114 USD na 41 USD.
Společnost DeepSeek tvrdí, že "záměrně sladila" tréninkové konfigurace verzí V3.1 Terminus a V3.2 Exp. Zdá se, že shoda výkonu verze V3.1 Terminus ukazuje, že výkonnostní výhody architektury DeepSeek Spare Attention nejsou na úkor inteligence.
Klíčové poznatky z benchmarkingu:
🧠 ➤ Žádná změna v souhrnné inteligenci: V režimu uvažování má DeepSeek V3.2 Exp skóre 57 v indexu umělé analýzy. To považujeme za inteligenci ekvivalentní DeepSeek V3.1 Terminus (uvažování)
📈 ➤ Žádný pokles v uvažování v dlouhém kontextu: Navzdory změnám architektury DeepSeek se zdá, že V3.2 Exp (uvažování) nevykazuje žádný pokles v uvažování v dlouhém kontextu - zaznamenal mírný nárůst v AA-LCR.
⚡ ➤ Výkon bez uvažování: V režimu bez uvažování nevykazuje DeepSeek V3.2 Exp žádné snížení inteligence a odpovídá DeepSeek V3.1 Terminus se skóre 46 v indexu umělé analýzy
⚙️ ➤ Efektivita tokenu: U DeepSeek V3.2 Exp (Reasoning) se využití tokenu ke spuštění indexu umělé analýzy mírně snižuje z 67M na 62M ve srovnání s V3.1 Terminus. Použití tokenu zůstává pro variantu bez zdůvodnění nezměněno
➤💲Ceny: Společnost DeepSeek výrazně snížila cenu za token pro své API první strany z 0,56 $/1,68 $ na 0,28/0,42 $ za 1 milion vstupních/výstupních tokenů – 50% a 75% snížení cen vstupních a výstupních tokenů.
Další detaily modelu:
©️ ➤ Licencování: DeepSeek V3.2 Exp je k dispozici pod licencí MIT
🌐 ➤ Dostupnost: DeepSeek V3.2 Exp je k dispozici prostřednictvím DeepSeek API, které nahradilo DeepSeek V3.1 Terminus. Uživatelé mají stále přístup k DeepSeek V3.1 Terminus prostřednictvím dočasného rozhraní DeepSeek API až do 15. října
📏 ➤ Velikost: DeepSeek V3.2 Exp má celkem 671B parametrů a 37B aktivních parametrů. To je stejné jako u všech předchozích modelů řady DeepSeek V3 a R1

41,31K
ServiceNow vydal Apriel-v1.5-15B-Thinker, 15B model uvažování s otevřenými váhami, který vede naši kategorii malých modelů (parametry <40B)
💼 Přehled: Apriel-v1.5-15B-Thinker je hustý model uvažování s otevřenými váhami o parametrech 15B. Nejedná se o první model, který ServiceNow vydal, ale jedná se o podstatný skok v dosažené inteligenci ve srovnání s předchozími verzemi
🧠 Inteligence: Model má v indexu umělé analýzy skóre 52. Tím se vyrovná DeepSeek R1 0528, který má mnohem větší architekturu parametrů 685B. Model ServiceNow boduje obzvláště dobře v důležitých chováních pro podnikové agenty, jako je následování instrukcí (62 % v IFBench, před gpt-oss-20B, uvažování) a víceotáčkové konverze a používání nástrojů (68 % v τ²-Bench Telecom, před gpt-oss-120B, uvažování). Díky tomu je obzvláště vhodný pro případy použití agentů, na což bylo pravděpodobně zaměřeno vzhledem k tomu, že ServiceNow je aktivní v oblasti podnikových agentů
⚙️ Výstupní tokeny a podrobnost: Model vytváří velké množství výstupních tokenů i mezi modely uvažování – pomocí ~110M kombinovaných tokenů uvažování a odpovědí k dokončení indexu umělé analýzy
🖥️ Přístup: Tento model zatím neobsluhují žádní bezserveroví poskytovatelé odvozování, ale je nyní k dispozici na Hugging Face pro místní odvozování nebo vlastní nasazení. Model byl vydán pod licencí MIT, která podporuje neomezené komerční použití
i️ Kontextové okno: Model má nativní kontextové okno se 128 tisíci tokeny.
Gratulujeme @ServiceNowRSRCH k tomuto působivému výsledku!

74,36K
Top
Hodnocení
Oblíbené