Jen tak pro zábavu, zde je to, jak vypadá 32 simultánních generací s dlouhým kontextem s Qwen3 Next 80B na M3 Ultra. Použití nové generace dávek v mlx-lm. Velikost kontextu pro každý z nich je asi 5 tisíc tokenů: