Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Sebbene Kimi k2 di Moonshot AI sia il principale modello di non ragionamento a pesi aperti nell'Artificial Analysis Intelligence Index, produce ~3 volte più token rispetto ad altri modelli non di ragionamento, offuscando i confini tra ragionamento e non ragionamento
Kimi k2 è il più grande modello a pesi aperti di sempre - parametri totali 1T con 32B attivi (questo richiede un enorme 1TB di memoria a FP8 nativo per sostenere i pesi). Abbiamo k2 a 57 nell'Artificial Analysis Intelligence Index, un punteggio impressionante che lo pone al di sopra di modelli come GPT-4.1 e DeepSeek V3, ma dietro ai principali modelli di ragionamento.
Fino ad ora, c'è stata una chiara distinzione tra modello di ragionamento e modelli non di ragionamento nelle nostre valutazioni, definita non solo dal fatto che il modello utilizzi <reasoning> i tag, ma principalmente dall'uso dei token. Il numero mediano di token utilizzati per rispondere a tutte le valutazioni nell'Artificial Analysis Intelligence Index è ~10 volte superiore per i modelli di ragionamento rispetto ai modelli non di ragionamento.
Kimi k2 di @Kimi_Moonshot utilizza ~3 volte il numero di token utilizzato dal modello mediano non ragionante. Il suo utilizzo di token è inferiore solo fino al 30% rispetto a Claude 4 Sonnet e Opus quando viene eseguito nella loro modalità di pensiero estesa con budget massimo, ed è quasi il triplo dell'utilizzo di token sia di Claude 4 Sonnet che di Opus con il ragionamento disattivato.
Raccomandiamo quindi che Kimi k2 sia paragonato a Claude 4 Sonnet e Opus nelle loro modalità di pensiero esteso con il budget massimo, non ai punteggi non ragionanti per i modelli Claude 4.
Kimi k2 è disponibile sulle API proprietarie di @Kimi_Moonshot, nonché su @FireworksAI_HQ, @togethercompute, @novita_labs e @parasail_io.
Vedi sotto e su Analisi Artificiale per ulteriori analisi 👇



60,53K
Principali
Ranking
Preferiti