Nový antropický výzkum: Známky introspekce u LLM. Dokážou jazykové modely rozpoznat své vlastní vnitřní myšlenky? Nebo si jen vymýšlejí věrohodné odpovědi, když se jich na ně zeptáte? Našli jsme u Clauda důkazy o skutečných – i když omezených – introspektivních schopnostech.