Práce na vyhodnocení na základě reálných stop a podpora @langfuse @braintrustdata a Langsmith od @LangChainAI byla velmi vzrušující. Chceme vývojářům pomoci vyhodnotit, co je skutečně důležité, ne nějaký samostatný akademický benchmark.