Kimi K2 ベンダーの verifier() が更新されました。 > プロバイダー間でツール呼び出しの精度の違いを視覚的に確認できます。プロバイダー数を 9 から 12 に更新し、より多くのデータ エントリをオープンソース化しました。 次のベンチマークラウンドを準備中であり、皆様のご意見が必要です。 気になる指標やテストケースがある場合は、ここにメモをドロップしてください( )