Sebbene Kimi k2 di Moonshot AI sia il principale modello di non ragionamento a pesi aperti nell'Artificial Analysis Intelligence Index, produce ~3 volte più token rispetto ad altri modelli non di ragionamento, offuscando i confini tra ragionamento e non ragionamento Kimi k2 è il più grande modello a pesi aperti di sempre - parametri totali 1T con 32B attivi (questo richiede un enorme 1TB di memoria a FP8 nativo per sostenere i pesi). Abbiamo k2 a 57 nell'Artificial Analysis Intelligence Index, un punteggio impressionante che lo pone al di sopra di modelli come GPT-4.1 e DeepSeek V3, ma dietro ai principali modelli di ragionamento. Fino ad ora, c'è stata una chiara distinzione tra modello di ragionamento e modelli non di ragionamento nelle nostre valutazioni, definita non solo dal fatto che il modello utilizzi <reasoning> i tag, ma principalmente dall'uso dei token. Il numero mediano di token utilizzati per rispondere a tutte le valutazioni nell'Artificial Analysis Intelligence Index è ~10 volte superiore per i modelli di ragionamento rispetto ai modelli non di ragionamento. Kimi k2 di @Kimi_Moonshot utilizza ~3 volte il numero di token utilizzato dal modello mediano non ragionante. Il suo utilizzo di token è inferiore solo fino al 30% rispetto a Claude 4 Sonnet e Opus quando viene eseguito nella loro modalità di pensiero estesa con budget massimo, ed è quasi il triplo dell'utilizzo di token sia di Claude 4 Sonnet che di Opus con il ragionamento disattivato. Raccomandiamo quindi che Kimi k2 sia paragonato a Claude 4 Sonnet e Opus nelle loro modalità di pensiero esteso con il budget massimo, non ai punteggi non ragionanti per i modelli Claude 4. Kimi k2 è disponibile sulle API proprietarie di @Kimi_Moonshot, nonché su @FireworksAI_HQ, @togethercompute, @novita_labs e @parasail_io. Vedi sotto e su Analisi Artificiale per ulteriori analisi 👇
60,53K