A propósito, eles lançaram uma análise aprofundada sobre o FP8 KVCache do MLA principal. então, na verdade, ≈1/5 em comparação com o FP8 denso MLA.