楽しみのために、Qwen3 Next 80B を使用した 32 の同時ロングコンテキスト生成が M3 Ultra でどのように見えるかを次に示します。 mlx-lm での新しいバッチ生成の使用。 それぞれのコンテキストサイズは約5kトークンです。