Nghiên cứu mới của Anthropic: Dấu hiệu của sự tự suy nghĩ trong các mô hình ngôn ngữ lớn (LLMs). Liệu các mô hình ngôn ngữ có thể nhận ra những suy nghĩ nội tâm của chính chúng không? Hay chúng chỉ đưa ra những câu trả lời hợp lý khi được hỏi về chúng? Chúng tôi đã tìm thấy bằng chứng cho khả năng tự suy nghĩ thực sự—mặc dù hạn chế—trong Claude.