Nueva investigación de Anthropic: Signos de introspección en los LLMs. ¿Pueden los modelos de lenguaje reconocer sus propios pensamientos internos? ¿O simplemente inventan respuestas plausibles cuando se les pregunta sobre ellos? Encontramos evidencia de capacidades introspectivas genuinas—aunque limitadas—en Claude.