跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+0.48%
USELESS
-1.16%
IKUN
-3.73%
gib
+15%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-0.26%
ALON
+0.61%
LAUNCHCOIN
-15.4%
GOONC
+4.3%
KLED
-2.35%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-1.21%
Boopa
-2.9%
PORK
-8.25%
主页
Nathan Barry
知识盗窃狂。以前@Apple,CS + 数学@UTAustin,@zfellows
查看原文
Nathan Barry
10月23日 01:24
正在尝试训练一个小型的11M参数字符级文本扩散模型! 这还是一个正在进行中的项目,但代码目前是一个 heavily modified nanochat gpt 实现(将自回归解码更改为扩散),并在 Tiny Shakespeare 数据集上进行训练。 简单的掩码调度实现是对每个迭代中的每个标记使用均匀的掩码概率。更新的方法是从左到右以块状方式进行掩码,这提高了输出质量并允许一些 KVCache 重用。 我意识到在生成过程中实际上可以以任何任意方式应用掩码。下面你可以看到我根据康威的生命游戏的规则应用了掩码。 我想知道是否有任何不寻常的掩码策略可以带来好处。无论如何,这是一种非常有趣和迷人的方式来破坏和变形文本。
114.38K
1.84K
Nathan Barry
10月21日 00:52
BERT 只是一个单一的文本扩散步骤! (1/n) 当我第一次阅读关于语言扩散模型的内容时,我惊讶地发现它们的训练目标只是掩码语言建模(MLM)的一个概括,这是我们自 2018 年以来一直在做的事情。 我想到的第一个问题是:“我们能否微调一个类似 BERT 的模型来进行文本生成?”
574.17K
815
Nathan Barry
10月17日 08:25
研究日志 第0天:DiLoCo日 我决定围绕分布式低通信训练撰写论文。基本上,我们如何能够在分布式节点之间高效地训练大型模型,而不被网络延迟和带宽彻底摧毁? (1/n)
913
6
热门
排行
收藏