Mengerjakan evaluasi berdasarkan jejak nyata dan mendukung @langfuse @braintrustdata dan Langsmith dari @LangChainAI sangat mengasyikkan. Kami ingin membantu pengembang mengevaluasi apa yang sebenarnya penting, bukan beberapa tolok ukur akademik mandiri.