Trabalhar na avaliação com base em rastros reais e apoiar @langfuse @braintrustdata e Langsmith da @LangChainAI tem sido super empolgante. Queremos ajudar os desenvolvedores a avaliar o que realmente importa, e não algum benchmark acadêmico isolado.