跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
DEX API
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
幫助中心
探索 Web3 Giveaway 活動,每週豐厚獎勵等您來領取
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-11.67%
USELESS
+12.75%
IKUN
-7.78%
gib
-5.75%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-0.4%
ALON
-5.37%
LAUNCHCOIN
+9.66%
GOONC
-3.88%
KLED
+3.01%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-2.75%
Boopa
-28.36%
PORK
-1.24%
主頁
Pratyush Ranjan Tiwari
構建保護隱私的個人 AI @eternisai,大量 RL/大量獎勵黑客攻擊,上一個博士 @JohnsHopkins,3X EF 密碼學受資助者,構建@ketlxyz
查看原文
Pratyush Ranjan Tiwari
20 小時前
該工作的初步版本將出現在 NeurIPS '25 高效推理研討會 一些更多的實驗和見解將在下一個 arxiv 更新中發佈 👀
Pratyush Ranjan Tiwari
2025年8月23日
我們介紹了一種更好的方法來收集使用GRPO後的訓練數據。向專家收集樣本是昂貴的,註釋預算有限。哪些示例實際上值得支付?我們發現,專注於困難樣本可以帶來30-40%的改善。 1/7
3.38K
12
Pratyush Ranjan Tiwari
9月23日 07:32
在過去的任何時刻,都沒有一個時刻是每一份工作都可以被自動化的。即使創造了新的就業崗位,我們也正進入一個階段,在這個階段中,新的工作 -> 生成數據 + 環境 -> 自動化工作將形成一個高效的循環。那麼接下來會發生什麼呢?
srikar
9月23日 07:14
這是什麼新類別的工作?它和我們在同一個房間裡嗎 👀。 想要自動化一切是可以的。這是當前的動態。然而,試圖通過指向尚不存在的工作來為此辯護並*不*令人感到希望。工業革命並沒有創造出能夠完成我們所有認知任務的機器。它們只是工具。 整個世界變成亞馬遜機械土耳其人*不*是任何人對美好未來的夢想。 這些與過去技術革命的類比在很大程度上是不誠實的。也許機器現在無法做到我們能做的一切,但在某個時刻它們會做到。值得認真思考在那樣的世界中社會如何重組,以及我們今天可以做些什麼。 收集數據並將其出售給實驗室是可以的。讓我們為自己建立一個大腦。也確實大多數人並不一定想要為了生存而工作,讓我們對人類的處境保持一些尊嚴。 相信超越人類的東西,同時追求一個由我們價值觀塑造的未來是高尚的,但這並不會通過把每個人都當作被送去數據提取的工廠豬來實現(除非這些豬也擁有工廠 ;))。
419
4
熱門
排行
收藏