Nowe badania Anthropic: Znaki introspekcji w LLM-ach. Czy modele językowe potrafią rozpoznać swoje własne wewnętrzne myśli? A może po prostu wymyślają wiarygodne odpowiedzi, gdy się o nie pytają? Znaleźliśmy dowody na prawdziwe—choć ograniczone—zdolności introspekcyjne w Claude.