"¿Por qué querrías descomponer un modelo de transformador en partes y entrenarlo en un enjambre de GPU de consumo?"