有没有什么类似的游乐场可以查看不同模型的工具使用/代理性能? 我想基本上给它5个工具和我通常的提示 然后游乐场生成大约5-10个案例并运行所有选定的模型 然后我观察并更改模型、提示
4.63K