MLA est une amélioration d'environ 5,6x par rapport à MHA, DSA est une amélioration de 9x par rapport à MLA Deepseek, en environ un an, a béni le monde avec la connaissance sur comment améliorer l'efficacité du mécanisme d'attention de 50x !!!