Ich habe gerade das Papier gelesen, und zuerst einmal, es ist ein gutes Papier! Sie haben tatsächlich das Pre-Training bis hin zum Downstream-Post-Training durchgeführt. Die Modelle sind klein, aber im Vergleich zu Billionen von Token LLMs ist die Einzelzell-Datenmenge einfach nicht so groß. Die Beibehaltung der Modellarchitektur war klug. ABER... hier ist das Ding. Es ist kein großer Wandel darin, wie das Feld die Dinge macht. Noch eine Demonstration neuer Fähigkeiten oder ein paradigmatischer Wandel in Präzision/Rückruf. Die Realität ist, dass Genexpressionsdaten, selbst auf Einzelzellebene, ihre Einschränkungen haben. Der Großteil des Signals wird von differentiell exprimierten Genen kommen: Sie müssen wahrscheinlich keine LLMs verwenden, um gute Hypothesen zu extrahieren. Also ist dies ein inkrementeller Fortschritt. Aber nehmen wir an, es gibt ein verborgenes Signal, das nur mit relevantem Kontext extrahiert werden kann, perfekt für LLMs. Angenommen, Sie erstellen ein Modell, von dem Sie denken, dass es diese Informationen extrahieren kann. Die entscheidende Frage ist: Wie testen Sie dies im großen Maßstab? Wie validiere ich, dass dieses Modell interessante Dinge findet, die ich mit einfacheren Methoden nicht hätte finden können? Das ist die echte Herausforderung, und nur eine Handvoll Experimente wird dies nicht beweisen. Angenommen, Sie führen diese Validierungsexperimente im großen Maßstab durch, geben viel $$ aus, warten viele Monate... und stellen fest, dass das Modell im Vergleich zur Basislinie nicht so gut ist, wie Sie dachten, was nun? Machen Sie eine weitere Runde großangelegten experimentellen Trainings und wiederholen Sie? Das ist teuer! Es ist viel teurer als die Standard-LLM-Sachen, bei denen Sie sich in Chat-Arenen und Benutzerdaten ELO/rangieren können. Und *das* ist der Grund, warum es so schwer ist, in der Biologie etwas zu bewegen. Der experimentelle Feedback-Zyklus bringt Sie um. Und wenn Sie Therapeutika entwerfen? Der Zyklus wird noch länger, Jahre oder Jahrzehnte, selbst wenn Sie echte Endpunkte messen wollen. Das ist die bittere Lektion in der Biologie: Assay ist König, am Krankenbett ist König -- rechnerische Methoden bringen Sie nur so weit, ohne umfangreiche experimentelle Validierungen. Ich glaube aus tiefstem Herzen, dass es einen Weg gibt, dies zu umgehen, aber wer auch immer diesen Code knackt, gewinnt.