跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-1.68%
USELESS
-2.77%
IKUN
+1.47%
gib
+10.01%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-0.35%
ALON
-3.1%
LAUNCHCOIN
-8.66%
GOONC
-1.83%
KLED
+3.1%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-1.14%
Boopa
-6.93%
PORK
-4.05%
主页
pablo
我在公园里玩耍时扔的球。尚未落地。 @stripe - Hexagonbio - 加州大学圣地亚哥分校 - 斯坦福大学
查看原文
pablo
10月16日 22:51
刚读完这篇论文,首先,它是一篇好论文!他们实际上进行了预训练,一直到下游的后训练。模型虽然小,但与万亿标记的LLM相比,单细胞数据实在不算大。保留模型架构是明智的。但是……事情是这样的。这并不是该领域做事方式的重大转变。也不是新能力的展示或精确度/召回率的范式转变。现实是,基因表达数据,即使在单细胞水平上,也有其局限性。大多数信号将来自差异表达的基因:你可能不需要使用LLM来提取好的假设。所以这只是一个渐进的进步。 但是,假设有一些隐藏的信号只能通过相关上下文提取,非常适合LLM。假设你创建了一个模型,你认为可以提取这些信息。关键问题是:你如何在大规模上测试这一点?我如何验证这个模型发现了我无法通过更简单的方法找到的有趣事物?这才是真正的挑战,仅仅做几次实验是无法证明这一点的。 假设你在大规模上进行这些验证实验,花费大量$$,等待许多个月……然后你意识到这个模型与基线相比并没有你想象的那么好,那现在怎么办?你还要进行另一轮大规模实验训练并重复吗?这太贵了!这比标准的LLM更贵,因为你可以在聊天领域和用户数据中进行ELO/排名。 而*这*就是为什么在生物学上推动进展如此困难。实验反馈循环会让你崩溃。如果你在设计治疗方案呢?这个循环变得更长,甚至需要数年或数十年才能测量真正的终点。 这是生物学中的苦涩教训:检测是王,临床是王——计算方法在没有广泛实验验证的情况下只能走到这一步。我深信不疑地认为有办法解决这个问题,但谁能破解这个代码,谁就赢了。
Sundar Pichai
10月16日 01:03
科学领域AI的一个激动人心的里程碑:我们与@Yale合作构建的C2S-Scale 27B基础模型,基于Gemma,生成了一个关于癌细胞行为的新假设,科学家们在活细胞中进行了实验验证。 通过更多的临床前和临床测试,这一发现可能揭示出一种有前景的新途径,用于开发抗击癌症的疗法。
22.71K
148
热门
排行
收藏