Huawei Research acaba de presentar SINQ en Hugging Face Una técnica de cuantificación novedosa y sin calibración que permite un rendimiento de LLM de última generación al tiempo que reduce drásticamente el uso de memoria.