Lavorare sulla valutazione basata su tracce reali e supportare @langfuse @braintrustdata e Langsmith di @LangChainAI è stato super entusiasmante. Vogliamo aiutare gli sviluppatori a valutare ciò che conta davvero, non qualche benchmark accademico isolato.