Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
DeepSeek запустил V3.2 Exp с новой архитектурой DeepSeek Sparse Attention (DSA), которая, как утверждается, снижает влияние квадратичного увеличения вычислений с длиной контекста.
Мы независимо протестировали V3.2 Exp и установили, что он достигает аналогичного уровня интеллекта, как DeepSeek V3.1 Terminus; DeepSeek перешел на использование V3.2 для своего основного API и снизил цены на API более чем на 50%. С обновленными ценами на первый API от DeepSeek стоимость запуска Индекса Искусственного Анализа Интеллекта снижается с 114 долларов до 41 доллара.
DeepSeek утверждает, что "умышленно согласовал" конфигурации обучения V3.1 Terminus и V3.2 Exp. Соответствие производительности V3.1 Terminus, похоже, демонстрирует, что преимущества производительности архитектуры DeepSeek Sparse Attention не идут в ущерб интеллекту.
Ключевые выводы из бенчмаркинга:
➤🧠 Нет изменений в совокупном интеллекте: В режиме рассуждения DeepSeek V3.2 Exp набирает 57 баллов в Индексе Искусственного Анализа Интеллекта. Мы считаем это эквивалентом интеллекта DeepSeek V3.1 Terminus (Рассуждение).
➤📈 Нет снижения в долгосрочном контексте рассуждений: Несмотря на изменения в архитектуре DeepSeek, V3.2 Exp (Рассуждение) не демонстрирует снижения в долгосрочном контексте рассуждений - набирая небольшое увеличение в AA-LCR.
➤⚡ Производительность вне рассуждений: В режиме вне рассуждений DeepSeek V3.2 Exp не показывает ухудшения интеллекта, соответствуя DeepSeek V3.1 Terminus с результатом 46 в Индексе Искусственного Анализа Интеллекта.
➤⚙️ Эффективность токенов: Для DeepSeek V3.2 Exp (Рассуждение) использование токенов для запуска Индекса Искусственного Анализа Интеллекта немного снижается с 67M до 62M по сравнению с V3.1 Terminus. Использование токенов остается неизменным для варианта вне рассуждений.
➤💲Цены: DeepSeek значительно снизил цену за токен для своего первого API с 0.56$/1.68$ до 0.28$/0.42$ за 1M входных/выходных токенов - снижение цен на 50% и 75% соответственно для входных и выходных токенов.
Другие детали модели:
➤©️ Лицензирование: DeepSeek V3.2 Exp доступен под лицензией MIT.
➤🌐 Доступность: DeepSeek V3.2 Exp доступен через API DeepSeek, который заменил DeepSeek V3.1 Terminus. Пользователи все еще могут получить доступ к DeepSeek V3.1 Terminus через временный API DeepSeek до 15 октября.
➤📏 Размер: DeepSeek V3.2 Exp имеет 671B общих параметров и 37B активных параметров. Это то же самое, что и у всех предыдущих моделей в сериях DeepSeek V3 и R1.

Сравните, как DeepSeek V3.2 Exp работает по сравнению с моделями, которые вы используете или рассматриваете на:
38,07K
Топ
Рейтинг
Избранное