DeepSeek запустил V3.2 Exp с новой архитектурой DeepSeek Sparse Attention (DSA), которая, как утверждается, снижает влияние квадратичного увеличения вычислений с длиной контекста. Мы независимо протестировали V3.2 Exp и установили, что он достигает аналогичного уровня интеллекта, как DeepSeek V3.1 Terminus; DeepSeek перешел на использование V3.2 для своего основного API и снизил цены на API более чем на 50%. С обновленными ценами на первый API от DeepSeek стоимость запуска Индекса Искусственного Анализа Интеллекта снижается с 114 долларов до 41 доллара. DeepSeek утверждает, что "умышленно согласовал" конфигурации обучения V3.1 Terminus и V3.2 Exp. Соответствие производительности V3.1 Terminus, похоже, демонстрирует, что преимущества производительности архитектуры DeepSeek Sparse Attention не идут в ущерб интеллекту. Ключевые выводы из бенчмаркинга: ➤🧠  Нет изменений в совокупном интеллекте: В режиме рассуждения DeepSeek V3.2 Exp набирает 57 баллов в Индексе Искусственного Анализа Интеллекта. Мы считаем это эквивалентом интеллекта DeepSeek V3.1 Terminus (Рассуждение). ➤📈 Нет снижения в долгосрочном контексте рассуждений: Несмотря на изменения в архитектуре DeepSeek, V3.2 Exp (Рассуждение) не демонстрирует снижения в долгосрочном контексте рассуждений - набирая небольшое увеличение в AA-LCR. ➤⚡ Производительность вне рассуждений: В режиме вне рассуждений DeepSeek V3.2 Exp не показывает ухудшения интеллекта, соответствуя DeepSeek V3.1 Terminus с результатом 46 в Индексе Искусственного Анализа Интеллекта. ➤⚙️ Эффективность токенов: Для DeepSeek V3.2 Exp (Рассуждение) использование токенов для запуска Индекса Искусственного Анализа Интеллекта немного снижается с 67M до 62M по сравнению с V3.1 Terminus. Использование токенов остается неизменным для варианта вне рассуждений. ➤💲Цены: DeepSeek значительно снизил цену за токен для своего первого API с 0.56$/1.68$ до 0.28$/0.42$ за 1M входных/выходных токенов - снижение цен на 50% и 75% соответственно для входных и выходных токенов. Другие детали модели: ➤©️ Лицензирование: DeepSeek V3.2 Exp доступен под лицензией MIT. ➤🌐 Доступность: DeepSeek V3.2 Exp доступен через API DeepSeek, который заменил DeepSeek V3.1 Terminus. Пользователи все еще могут получить доступ к DeepSeek V3.1 Terminus через временный API DeepSeek до 15 октября. ➤📏 Размер: DeepSeek V3.2 Exp имеет 671B общих параметров и 37B активных параметров. Это то же самое, что и у всех предыдущих моделей в сериях DeepSeek V3 и R1.
Сравните, как DeepSeek V3.2 Exp работает по сравнению с моделями, которые вы используете или рассматриваете на:
38,07K