跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
DEX API
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+3.83%
USELESS
-7.57%
IKUN
-2.85%
gib
-8.98%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-1.31%
ALON
+1.5%
LAUNCHCOIN
+8.05%
GOONC
+2.69%
KLED
+25.51%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
+1.03%
Boopa
+11.07%
PORK
-0.34%
主頁
elvis
使用 AI 代理進行構建 @dair_ai • 上一篇: Meta AI、Galactica、LLM、Elastic、PaperswithCode、博士 • 我分享瞭如何使用 LLM 和 AI 代理⬇️進行構建的見解
查看原文
elvis
22 小時前
擴展 RL 以應對萬億規模思維模型 擴展 RL 是一件困難的事情!但這個團隊可能找到了某種解決方案。 他們推出了 Ring-1T,一個擁有 1T 參數的 MoE 推理模型,每個標記活躍約 50B 參數。 它經過長期的 CoT SFT 階段訓練,然後是可驗證獎勵推理的 RL 階段,接著是一般的 RLHF 階段,並引入了三個使萬億規模 RL 實際運行的組件: - IcePop 用於穩定更新 - C3PO++ 用於在標記預算下保持 GPU 忙碌 - ASystem 用於統一高吞吐量的 RL 堆棧 在基準測試中,它在 AIME-25、HMMT-25、ARC-AGI-1、LiveCodeBench、CodeForces 和 ArenaHard v2 上領先開放權重。 它在 IMO-2025 上達到銀牌水平,僅使用自然語言推理。
22.72K
294
elvis
10月22日 01:14
突發消息:OpenAI 推出 ChatGPT Atlas。 一款以 ChatGPT 為核心的新型 AI 瀏覽器。 聊天隨時隨地陪伴你上網。
15.01K
76
elvis
10月21日 21:36
人們對深度代理人視而不見。 現在就開始使用它們吧。 這是一篇有趣的論文,展示了如何為企業用例組建先進的深度代理人。 使用最佳技術:任務分解、規劃、專門的子代理、NL2SQL的MCP、文件分析等等。
49K
641
熱門
排行
收藏