基于真实数据进行评估并支持 @langfuse @braintrustdata 和来自 @LangChainAI 的 Langsmith 让人感到非常兴奋。我们希望帮助开发者评估真正重要的内容,而不是一些学术上的独立基准。