Apenas por diversão, aqui está como 32 gerações de longo contexto simultâneas com Qwen3 Next 80B se parecem em um M3 Ultra. Usando a nova geração em lote no mlx-lm. O tamanho do contexto para cada um é de cerca de 5k tokens: