Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Det är bara att läsa tidningen, och först och främst, det är en bra tidning! De gick faktiskt och gjorde förträning hela vägen till nedströms efter träningen. Modellerna är små, men jämfört med biljoner token LLM:er är encellsdata helt enkelt inte så stora. Att behålla modellbågen var smart. MEN... Så här ligger det till. Det är inte en stor förändring i hur fältet gör saker. Inte heller en demonstration av nya förmågor eller ett paradigmatiskt skifte i precision/träffsäkerhet. Verkligheten är att genuttrycksdata, även på encellsnivå, har sina begränsningar. Det mesta av signalen kommer att komma från differentiellt uttryckta gener: du behöver sannolikt inte göra LLM:er för att detta ska extrahera bra hypoteser. Så detta är ett stegvis framsteg.
Men låt oss anta att det finns någon dold signal som bara kan extraheras med relevant sammanhang, perfekt för LLM:er. Anta att du skapar en modell som du tror kan extrahera denna information. Den viktigaste frågan är: hur testar du detta i stor skala? Hur gör jag för att validera att den här modellen hittar intressanta saker som jag inte hade kunnat hitta med enklare metoder? Detta är den verkliga utmaningen och att bara göra en handfull experiment kommer inte att bevisa detta.
Anta att du gör dessa valideringsexperiment i stor skala, du spenderar massor av $$, väntar många månader... Och du inser att modellen inte är så bra jämfört med baslinjen som du trodde, vad händer nu? Gör du en ny omgång experimentell träning i stor skala och upprepar? Det är dyrt! Det är mycket dyrare än vanliga LLM-grejer där du kan ELO/ranka dig fram i chattarenor och användardata.
Och *detta* är anledningen till att det är så svårt att flytta nålen i biologin. Den experimentella återkopplingsslingan dödar dig bara. Och om du designar terapier? Loopen blir ännu längre, år eller decennier även om man vill mäta verkliga endpoints.
Det är den bittra läxan inom biologin: analys är kung, sängkanten är kung – beräkningsmetoder kommer bara att ta dig en bit på vägen utan omfattande experimentella valideringar. Jag tror innerst inne att det finns en väg runt detta, men den som knäcker den här koden vinner.
Topp
Rankning
Favoriter

