予想通り、NSA は MLA と互換性がないため、DeepSeek は別の方法を選択しました: より小さい (d=128) アテンション (値なし) インデクサーとして使用します。 漸近コスト比 = 128/576。 さらに、インデクサーは FP8 を使用しますが、メイン MLA は 16 ビットを使用するため、= 64/576 = 1/9 になります。