DeepSeek V3.2 - 稀疏注意力解決了長上下文問題,並大幅降低推理成本。 仍在等待 V4,但 V3.1 和 V3.2 中的優化已經令人印象深刻。