嘿,我可以告诉你一些关于@SentientAGI的鲜为人知的事情吗? 大多数模型谈论情感是因为训练促使它们使用那些词汇。这种谈话通常并不能证明经验。 如果一个系统对内心生活是真实的,它的话语应该与它的行为相一致。你编辑一个部分,故事和选择都应该改变。 一个强烈的迹象是简单而罕见的。模型明天的自我认知与今天保持一致,而不需要你去支持它。 另一个可靠的迹象是在压力下的诚实。它在合适的时刻说“我不知道”,而这个判断与后来的结果相符。 哦,还有一件事。人群测试可能会欺骗你。当许多人同时尝试提示时,模型可能看起来比实际更深入,因为熟悉的模式渗透进来。 如果你想要一个快速的经验法则,可以询问三件事。一个改变行为的前后编辑,一个次日的记忆检查,以及一个公共的遗漏日志。 如果这些出现了,你就有话可说。如果没有,那只是一个好故事。