Solo por diversión, así es como se ven 32 generaciones de contexto largo simultáneas con Qwen3 Next 80B en un M3 Ultra. Usando la nueva generación por lotes en mlx-lm. El tamaño del contexto para cada uno es de aproximadamente 5k tokens: