DeepSeek V3.2 - 稀疏注意力解决了长上下文问题,并大幅降低了推理成本。 仍在等待 V4,但 V3.1 和 V3.2 中的优化已经令人印象深刻。