Huawei Research vừa công bố SINQ trên Hugging Face Một kỹ thuật lượng tử hóa mới, không cần hiệu chỉnh, cho phép hiệu suất LLM hàng đầu trong khi giảm đáng kể mức sử dụng bộ nhớ.