тем не менее, то, как вы воспринимаете несоответствие, будет в некотором смысле глупо и наивно в ретроспективе. а потом я вижу, как люди делают все эти графики с обманом, манипуляциями и оценками вознаграждений и, предположительно, используют такие вещи в качестве целевой оптимизации. типа, окей, я понимаю, что ваша онтология сейчас ограничена, и вам просто нужно работать с тем, что у вас есть. Я не против проводить исследования в этом контексте, если это имеет смысл для вас. но, пожалуйста, не делайте из этого хорошуюhart, брат. слишком рано думать, что вы знаете, как количественно оценить добро и зло. используйте свою интуицию вместо этого. это лучше. "но это не масштабируется!" вы знаете, у кого тоже есть интуиция и кто масштабируется? LLMs.