A Huawei Research acaba de revelar o SINQ no Hugging Face Uma técnica de quantização nova e sem calibração que permite um desempenho de LLM de última geração enquanto reduz drasticamente o uso de memória.