“你为什么想把一个变压器模型拆分成多个部分,并在消费级GPU群中训练它?”