MLA é uma melhoria de ~5.6x em relação ao MHA, DSA é uma melhoria de 9x em relação ao MLA Deepseek, em cerca de um ano, abençoou o mundo com o conhecimento sobre como melhorar a eficiência do mecanismo de atenção em 50x!!!