热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
初始化对LoRA微调动态的影响
一项干净的科学探索,也是我今年读过的更好的论文之一。(是的,我几乎已经被LoRA洗脑了)
在低秩适应中,我们通常训练添加到权重中的适配器A和B,形式为W + BA。我们需要将B或A初始化为零,以保持网络在初始化时的行为。
总结一下,最好将B设置为零。学习速度更快,允许使用更大的学习率。这让我感到相当惊讶。


热门
排行
收藏