跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+3.83%
USELESS
-7.32%
IKUN
-1.74%
gib
-8.98%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-0.24%
ALON
+1.5%
LAUNCHCOIN
+8.37%
GOONC
+2.69%
KLED
+29.64%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+1.03%
Boopa
+11.07%
PORK
-0.34%
主页
elvis
使用 AI 代理进行构建 @dair_ai • 上一篇: Meta AI、Galactica、LLM、Elastic、PaperswithCode、博士 • 我分享了如何使用 LLM 和 AI 代理⬇️进行构建的见解
查看原文
elvis
22 小时前
扩展RL以应对万亿规模思维模型 扩展RL很难!但这个团队可能找到了某种解决方案。 他们推出了Ring-1T,一个具有1T参数的MoE推理模型,每个token大约激活50B参数。 它经过了长CoT SFT阶段的训练,接着是可验证奖励推理的RL阶段,然后是一般的RLHF阶段,并引入了三个使万亿规模RL实际运行的组件: - IcePop用于稳定更新 - C3PO++在token预算下保持GPU忙碌 - ASystem统一高吞吐量的RL堆栈 在基准测试中,它在AIME-25、HMMT-25、ARC-AGI-1、LiveCodeBench、CodeForces和ArenaHard v2上领先开放权重。 在IMO-2025上仅使用自然语言推理就达到了银牌水平。
22.72K
294
elvis
10月22日 01:14
突发消息:OpenAI推出ChatGPT Atlas。 一款围绕ChatGPT构建的新型AI驱动浏览器。 聊天可以随时随地陪伴你上网。
15.01K
76
elvis
10月21日 21:36
人们对深度代理视而不见。 现在就开始使用它们吧。 这是一篇有趣的论文,展示了如何为企业用例组装先进的深度代理。 使用了最佳技术:任务分解、规划、专业子代理、NL2SQL的MCP、文件分析等等。
49.01K
641
热门
排行
收藏