Doar pentru distracție, iată cum arată 32 de generații simultane cu context lung cu Qwen3 Next 80B pe un M3 Ultra. Utilizarea noii generații de loturi în mlx-lm. Dimensiunea contextului pentru fiecare este de aproximativ 5k jetoane: