BERT este doar un singur pas de difuzare a textului! (1/n) Când am citit pentru prima dată despre modelele de difuzie a limbajului, am fost surprins să descopăr că obiectivul lor de antrenament era doar o generalizare a modelării limbajului mascat (MLM), ceva ce facem de la BERT din 2018. Primul gând pe care l-am avut a fost: "Putem regla un model asemănător BERT pentru a face generarea de text?"