A proposito, hanno pubblicato un'analisi approfondita su FP8 KVCache del principale MLA. quindi, in realtà ≈1/5 rispetto a FP8 dense MLA.