Hanya untuk bersenang-senang, inilah 32 generasi konteks panjang simultan dengan Qwen3 Next 80B pada M3 Ultra. Menggunakan generasi batch baru di mlx-lm. Ukuran konteks untuk masing-masing adalah sekitar 5 ribu token: