DeepSeek V3.2 - spärliche Aufmerksamkeit löst das Problem mit langen Kontexten und senkt die Inferenzkosten um einen großen Faktor. Ich warte immer noch auf V4, aber die Optimierungen in V3.1 und V3.2 sind beeindruckend.