Стан моделей DeepSeek: У вересні компанія DeepSeek запустила свої нові гібридні моделі міркувань V3.1 Terminus і V3.2 Exp, зробивши значні кроки як в інтелектуальній, так і в економічній ефективності Обидві моделі можуть використовуватися в режимах міркування і без міркування, і призначені для заміни як попередніх моделей V3, так і R1. DeepSeek V3.1 Terminus підскочив на 4 пункти вище в індексі інтелекту штучного аналізу, ніж оригінальний реліз V3.1 без суттєвої кількості токенів, а V3.2 Experimental зберегла більшу частину цих прибутків, значно знизивши витрати на токен завдяки новій експериментальній архітектурі DeepSeek. DeepSeek V3.1 Terminus і V3.2 Exp мають аналогічні показники в штучному аналізі, причому V3.1 Terminus на один пункт вище V3.2 Exp. Обидва є суттєвим оновленням більш ранніх моделей V3 і R1. Ряд провайдерів обслуговують обидві моделі, причому доступність V3.2 все ще розширюється: ➤ Terminus DeepSeek V3.1 доступний на SambaNova, DeepInfra, Fireworks, GMI та Novita, причому @SambaNovaAI пропонує швидкість виведення ~250 токенів на секунду (приблизно в 10 разів швидше, ніж DeepSeek first-party inference) ➤ DeepSeek V3.2 Exp доступний на основних API DeepSeek, DeepInfra, GMI та Novita - причому DeepInfra обслуговує його найшвидше зі швидкістю до 79 токенів на секунду
Нижче наведено порівняння провайдерів для обох цих нових моделей DeepSeek:
20,17K