Dla zabawy, oto jak wyglądają 32 jednoczesne generacje długiego kontekstu z Qwen3 Next 80B na M3 Ultra. Używając nowej generacji wsadowej w mlx-lm. Rozmiar kontekstu dla każdej to około 5k tokenów: