Bare for moro skyld, her er hvordan 32 samtidige generasjoner med lang kontekst med Qwen3 Next 80B ser ut på en M3 Ultra. Bruke den nye batchgenerasjonen i mlx-lm. Kontekststørrelsen for hver er omtrent 5k tokens: