基於真實痕跡進行評估的工作,以及支持 @langfuse @braintrustdata 和來自 @LangChainAI 的 Langsmith,讓人感到非常興奮。我們希望幫助開發者評估實際重要的事物,而不是某些學術獨立基準。