Nouvelle recherche d'Anthropic : Signes d'introspection dans les LLM. Les modèles de langage peuvent-ils reconnaître leurs propres pensées internes ? Ou inventent-ils simplement des réponses plausibles lorsqu'on leur pose des questions à ce sujet ? Nous avons trouvé des preuves de capacités introspectives authentiques—bien que limitées—dans Claude.