Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Společnost Meta právě vypustila tento článek, který na LLM rozlévá tajnou omáčku zpětnovazebního učení (RL).
Předkládá recept RL, využívá 400 000 hodin GPU a postuluje zákon škálování pro výkon s větším výpočetním výkonem v RL, jako klasické zákony škálování před trénováním.
Povinná četba pro AI nerdy.

Zdroj:
102,64K
Top
Hodnocení
Oblíbené