Lucrul la evaluarea bazată pe urme reale și sprijinirea @langfuse @braintrustdata și Langsmith de la @LangChainAI a fost foarte interesant. Vrem să ajutăm dezvoltatorii să evalueze ceea ce contează cu adevărat, nu un punct de referință academic de sine stătător.