LoRA dolaďuje Qwen3 4B na DGX spark s mlx / mlx-lm. Získá velmi slušných ~1200 tok/sec.