« Pourquoi voudriez-vous jamais décomposer un modèle de transformateur en morceaux et l'entraîner dans un essaim de GPU grand public ? »