Trabajar en una evaluación basada en rastros reales y apoyar a @langfuse @braintrustdata y Langsmith desde @LangChainAI ha sido muy emocionante. Queremos ayudar a los desarrolladores a evaluar lo que realmente importa, no un punto de referencia académico independiente.