Übrigens haben sie eine tiefgehende Analyse des FP8 KVCache des Haupt-MLA veröffentlicht. Also, tatsächlich ≈1/5 im Vergleich zu FP8 dichten MLA.