Solo por diversión, así es como se ven 32 generaciones simultáneas de contexto largo con Qwen3 Next 80B en un M3 Ultra. Usando la nueva generación de lotes en mlx-lm. El tamaño del contexto para cada uno es de aproximadamente 5k tokens: