kiedy ludzie nie chcą używać uzupełnień czatu do realizacji RL, jestem tak zdezorientowany, bo jak planowałeś wnioskowanie modelu do czegokolwiek użytecznego po jego wytrenowaniu? czy nie planowałeś tego robić?
@ellev3n11 completions + apply_chat_template to w zasadzie to samo, co robią silniki wnioskowania w tle :) uważam, że to dość wygodne, że mogę budować/oceniać środowiska z dowolnymi modelami API, chociaż chat completions znacznie to upraszcza.
16,16K