Kun ihmiset eivät halua käyttää chatin täydennyksiä RL:n käyttöönottoon, olen niin hämmentynyt siitä, miten suunnittelit päätteleväsi mallista mitään hyödyllistä sen kouluttamisen jälkeen? Vai etkö aikonut tehdä niin?
@ellev3n11 täydennykset + apply_chat_template on periaatteessa sama asia kuin mitä päättelymoottorit tekevät konepellin alla muutenkin :) minusta on varsin kätevää pystyä rakentamaan/eval-env:tä mielivaltaisilla API-malleilla, vaikka chatin valmistuminen virtaviivaistaa sitä paljon
16,17K