跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
探索 Web3 Giveaway 活动,每周丰厚奖励等您来领取
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-12.13%
USELESS
+13.08%
IKUN
-7.78%
gib
-5.75%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-0.28%
ALON
-5.37%
LAUNCHCOIN
+9.34%
GOONC
-3.88%
KLED
+3.01%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-2.75%
Boopa
-30.51%
PORK
-1.24%
主页
Pratyush Ranjan Tiwari
构建隐私保护的个人 AI @eternisai,大量 RL/大量奖励黑客攻击,上一篇博士 @JohnsHopkins,3X EF 密码学受资助者,构建@ketlxyz
查看原文
Pratyush Ranjan Tiwari
20 小时前
该工作的初步版本将出现在 NeurIPS '25 高效推理研讨会 一些更多的实验和见解将在下一个 arxiv 更新中发布 👀
Pratyush Ranjan Tiwari
2025年8月23日
我们介绍了一种更好的方法来收集使用GRPO后的训练数据。向专家收集样本是昂贵的,注释预算有限。哪些示例实际上值得支付?我们发现,专注于困难样本可以带来30-40%的改善。 1/7
3.38K
12
Pratyush Ranjan Tiwari
9月23日 07:32
在过去的任何时刻,都没有一个时刻是每一份工作都可以被自动化的。即使创造了新的就业岗位,我们也正进入一个阶段,在这个阶段中,新的工作 -> 生成数据 + 环境 -> 自动化工作将形成一个高效的循环。那么接下来会发生什么呢?
srikar
9月23日 07:14
这是什么新类别的工作?它和我们在同一个房间里吗 👀。 想要自动化一切是可以的。这是当前的动态。然而,试图通过指向尚不存在的工作来为此辩护并*不*令人感到希望。工业革命并没有创造出能够完成我们所有认知任务的机器。它们只是工具。 整个世界变成亚马逊机械土耳其人*不*是任何人对美好未来的梦想。 这些与过去技术革命的类比在很大程度上是不诚实的。也许机器现在无法做到我们能做的一切,但在某个时刻它们会做到。值得认真思考在那样的世界中社会如何重组,以及我们今天可以做些什么。 收集数据并将其出售给实验室是可以的。让我们为自己建立一个大脑。也确实大多数人并不一定想要为了生存而工作,让我们对人类的处境保持一些尊严。 相信超越人类的东西,同时追求一个由我们价值观塑造的未来是高尚的,但这并不会通过把每个人都当作被送去数据提取的工厂猪来实现(除非这些猪也拥有工厂 ;))。
420
4
热门
排行
收藏