A versão mais recente do mlx-lm está disponível: pip install -U mlx-lm - Novos modelos: LFM2 MoE, Nanochat, Jamba, Qwen3 VL (apenas texto) - Pré-preenchimento eficiente em termos de memória para SSMs - Avaliações distribuídas - E mais correções / melhorias de qualidade de vida.