Huawei Research acaba de presentar SINQ en Hugging Face Una técnica de cuantización novedosa y sin calibración que permite un rendimiento de LLM de última generación mientras reduce drásticamente el uso de memoria.