华为研究院刚刚在 Hugging Face 上发布了 SINQ 这是一种新颖的、无校准的量化技术,能够在大幅减少内存使用的同时,实现最先进的 LLM 性能。