men du oppfatter at feiljustering kommer til å være litt dum og naiv på noen måter i ettertid. Og så ser jeg folk lage alle disse diagrammene med bedrag og sandbagging og belønningshacking-poeng og antagelig bruke den slags ting som et optimaliseringsmål. Som OK, jeg forstår at ontologien din er begrenset RN, og du må bare jobbe med det du har. Jeg er ikke imot å gjøre forskningen under den rammen hvis det gir mening for deg. Men vær så snill, ikke godhjort det bror. Det er altfor tidlig å tro at du vet hvordan du skal kvantifisere godt og ondt. Bruk intuisjonen din i stedet. Det er bedre. «Men det skalerer ikke!» vet du hvem som også har intuisjon og skalaer? LLM-er.