Просто для розваги, ось як виглядають 32 одночасних покоління з довгим контекстом з Qwen3 Next 80B на M3 Ultra. Використання нової пакетної генерації в mlx-lm. Розмір контексту для кожного становить близько 5 тисяч токенів: