MLA ist eine ~5,6-fache Verbesserung gegenüber MHA, DSA ist eine 9-fache Verbesserung gegenüber MLA Deepseek hat der Welt in etwa einem Jahr das Wissen geschenkt, wie man die Effizienz des Aufmerksamkeitsmechanismus um 50x verbessern kann!!!