MLA является улучшением примерно на 5.6x по сравнению с MHA, DSA — улучшением на 9x по сравнению с MLA Deepseek за примерно год благословил мир знаниями о том, как повысить эффективность механизма внимания на 50x!!!