DeepSeek V3.2 - スパースアテンションは、長いコンテキストを解決し、推論コストを大幅に削減します。 まだ V4 を待っていますが、V3.1 と V3.2 ですでに行われている最適化は印象的です。