Doar citiți lucrarea și, în primul rând, este o lucrare bună! De fapt, au mers și au făcut pre-antrenament până în aval după antrenament. Modelele sunt mici, dar în comparație cu trilioanele de LLM-uri de token, datele cu o singură celulă nu sunt atât de mari. Păstrarea arcului model a fost inteligentă. DAR... Iată chestia. Nu este o schimbare majoră în modul în care domeniul face lucrurile. Nici o demonstrație de noi capacități sau o schimbare paradigmatică în precizie/reamintire. Realitatea este că datele de expresie a genelor, chiar și la nivel de celulă unică, au limitările sale. Cea mai mare parte a semnalului va veni de la gene exprimate diferențial: probabil că nu trebuie să faceți LLM pentru a extrage ipoteze bune. Deci acesta este un progres incremental. Dar, să presupunem că există un semnal ascuns care poate fi extras doar cu context relevant, perfect pentru LLM-uri. Să presupunem că creați un model care credeți că poate extrage această informație. Întrebarea cheie este: cum testați acest lucru la scară? Cum validez că acest model găsește lucruri interesante pe care nu le-aș fi putut găsi folosind metode mai simple? Aceasta este adevărata provocare și doar o mână de experimente nu va dovedi acest lucru. Să presupunem că faceți aceste experimente de validare la scară largă, cheltuiți o mulțime de $$, așteptați multe luni... Și îți dai seama că modelul nu este la fel de bun în comparație cu linia de bază pe cât ai crezut, ce se întâmplă acum? Faceți o altă rundă de antrenament experimental la scară majoră și repetați? Este scump! Este mult mai scump decât lucrurile standard LLM, unde vă puteți clasifica în arenele de chat și datele utilizatorilor. Și *de aceea* mișcarea acului în biologie este atât de grea. Bucla de feedback experimental pur și simplu te ucide. Și dacă proiectezi terapii? Bucla devine și mai lungă, ani sau decenii, chiar dacă doriți să măsurați adevăratele puncte finale. Aceasta este lecția amară în biologie: testul este rege, patul este rege - metodele computaționale nu te vor duce departe decât până la un punct, fără validări experimentale extinse. Cred în adâncul inimii mele că există departe în jurul acestui lucru, dar oricine sparge acest cod câștigă.