Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Virkningen av initialisering på LoRA-finjusteringsdynamikken
En ren bit av vitenskapelig utforskning og en av de bedre artiklene jeg har lest hele året. (og ja, jeg er ganske mye LoRA-pillet)
i Low-Rank Adaptation trener vi vanligvis adaptere A og B som legges til vekter som W + BA. vi må initialisere enten B eller A til null for å bevare nettverksoppførselen ved init
TLDR det er bedre å sette B til nuller. lærer raskere, lar deg bruke større læringshastigheter. ganske overraskende for meg


Topp
Rangering
Favoritter