Компанія DeepSeek запустила V3.2 Exp зі своєю новою архітектурою DeepSeek Sparse Attention (DSA), яка стверджує, що зменшує вплив квадратичного масштабування обчислень на довжину контексту Ми незалежно порівняли V3.2 Exp як таку, що має подібний інтелект до DeepSeek V3.1 Terminus; DeepSeek перейшли на використання V3.2 для своєї основної кінцевої точки API та знизили ціну на API на >50%. Завдяки оновленим цінам на API першої сторони DeepSeek вартість запуску індексу інтелекту штучного аналізу впала зі 114 доларів США до 41 долара. DeepSeek стверджує, що «навмисно вирівняв» тренувальні конфігурації V3.1 Terminus і V3.2 Exp. Відповідність продуктивності V3.1 Terminus, схоже, демонструє, що переваги продуктивності архітектури DeepSeek Spare Attention не коштують інтелекту. Ключові висновки бенчмаркінгу: 🧠 ➤ Відсутність змін у сукупному інтелекті: у режимі міркувань DeepSeek V3.2 Exp отримує 57 балів за індексом інтелекту штучного аналізу. Ми розглядаємо це як еквівалент за інтелектом DeepSeek V3.1 Terminus (Reasoning) 📈 ➤ Відсутність зниження в міркуваннях з довгим контекстом: Незважаючи на зміни в архітектурі DeepSeek, V3.2 Exp (Reasoning), схоже, не демонструє жодного зниження в міркуваннях з довгим контекстом - це невелике зростання в AA-LCR. ⚡ ➤ Продуктивність без міркувань: У режимі без міркувань DeepSeek V3.2 Exp не демонструє погіршення інтелекту, відповідаючи DeepSeek V3.1 Terminus з оцінкою 46 балів за індексом інтелекту штучного аналізу ⚙️ ➤ Ефективність токена: Для DeepSeek V3.2 Exp (Reasoning) використання токена для запуску Artificial Analysis Intelligence Index дещо знижується з 67 Млн до 62 млн порівняно з V3.1 Terminus. Використання токенів залишається незмінним для варіанту без обґрунтування ➤💲Ціноутворення: DeepSeek значно знизив ціну за токен для свого основного API з $0,56/$1,68 до $0,28/$0,42 за 1M токенів введення/виведення - зниження на 50% і 75% у ціні вхідних та вихідних токенів відповідно. Інші деталі моделі: ©️ ➤ Ліцензування: DeepSeek V3.2 Exp доступний за ліцензією MIT 🌐 ➤ Доступність: DeepSeek V3.2 Exp доступний через DeepSeek API, який замінив DeepSeek V3.1 Terminus. Користувачі все ще можуть отримати доступ до DeepSeek V3.1 Terminus через тимчасовий API DeepSeek до 15 жовтня 📏 ➤ Розмір: DeepSeek V3.2 Exp має 671B загальних параметрів і 37B активних параметрів. Це так само, як і у всіх попередніх моделей серій DeepSeek V3 і R1
Порівняйте, як працює DeepSeek V3.2 Exp порівняно з моделями, які ви використовуєте або розглядаєте:
35,23K