A Huawei Research acaba de revelar o SINQ sobre o Hugging Face Uma nova técnica de quantização sem calibração que permite o desempenho de LLM de última geração enquanto reduz drasticamente o uso de memória.