Apenas por diversão, aqui está a aparência de 32 gerações simultâneas de contexto longo com Qwen3 Next 80B em um M3 Ultra. Usando a nova geração de lote em mlx-lm. O tamanho do contexto para cada um é de cerca de 5k tokens: