🚀 Innoissamme voidessamme jakaa työmme Bytedance Seedissä! Knapsack RL: LLM:n tutkimisen avaaminen budjettimäärärahojen avulla 🎒 LLM-koulutuksen tutkiminen on ratkaisevan tärkeää, mutta kallista. Yhtenäinen käyttöönotto on tuhlausta: ✅ Helpot tehtävät → aina ratkaistu → 0 kaltevuus ❌ Vaikeat tehtävät → aina epäonnistuvat → 0 kaltevuus 💡 Ajatuksemme: käsitellä etsintää reppuongelmana → kohdentaa käyttöönotot sinne, missä niillä on eniten merkitystä. ✨ Tulokset: 🔼 +20–40 % enemmän nollasta poikkeavia kaltevuuksia 🧮 Jopa 93 käyttöönottoa vaikeisiin tehtäviin (ilman ylimääräistä laskentaa) 📈 +2–4 keskiarvopistettä, +9 huippuvoittoa matematiikan vertailuarvoissa 💰 ~2× halvempaa kuin yhtenäinen jako 📄 Paperi: