「你為什麼會想要將一個變壓器模型拆分成幾個部分,並在消費者 GPU 群中訓練它?」