Состояние моделей DeepSeek: DeepSeek запустил свои новые модели гибридного рассуждения V3.1 Terminus и V3.2 Exp в быстром succession в сентябре, сделав значительные шаги как в области интеллекта, так и в эффективности затрат. Обе модели могут использоваться в режимах рассуждения и нерассуждения и предназначены для замены как предыдущих моделей V3, так и R1. DeepSeek V3.1 Terminus поднялся на 4 пункта выше в Индексе Искусственного Анализа Интеллекта по сравнению с оригинальным релизом V3.1 без существенно большего количества токенов, а V3.2 Experimental сохранил большую часть этих достижений, значительно снизив затраты на токен благодаря экспериментальной новой архитектуре DeepSeek. DeepSeek V3.1 Terminus и V3.2 Exp имеют схожие оценки в Искусственном Анализе, при этом V3.1 Terminus на один пункт выше V3.2 Exp. Обе модели являются значительными обновлениями по сравнению с более ранними моделями V3 и R1. Ряд провайдеров обслуживает обе модели, при этом доступность V3.2 все еще расширяется: ➤ DeepSeek V3.1 Terminus доступен на SambaNova, DeepInfra, Fireworks, GMI и Novita, при этом @SambaNovaAI предлагает скорости вывода около 250 токенов в секунду (примерно в 10 раз быстрее, чем вывод DeepSeek первой стороны). ➤ DeepSeek V3.2 Exp доступен на первом API DeepSeek, DeepInfra, GMI и Novita - при этом DeepInfra обслуживает его быстрее всего со скоростью до 79 токенов в секунду.
Смотрите ниже наше сравнение провайдеров для обеих этих новых моделей DeepSeek:
20,18K