«Почему вы вообще хотите разбить трансформерную модель на части и обучать её в рое потребительских GPU?»