Solo per divertimento, ecco come si presenta la generazione di 32 contesti lunghi simultanei con Qwen3 Next 80B su un M3 Ultra. Utilizzando la nuova generazione batch in mlx-lm. La dimensione del contesto per ciascuno è di circa 5k token: