Juste pour le plaisir, voici à quoi ressemblent 32 générations de long contexte simultanées avec Qwen3 Next 80B sur un M3 Ultra. Utilisation de la nouvelle génération par lot dans mlx-lm. La taille du contexte pour chacune est d'environ 5k tokens :