Кстати, они выпустили глубокий анализ FP8 KVCache основного MLA. Так что, на самом деле, ≈1/5 по сравнению с FP8 плотным MLA.