Gemini が 2.0 から 2.5 にジャンプした内訳を聞きましたが、要点は次のとおりです。 チームは臨床検査だけに頼っていませんでした。彼らはXから実際のユーザーからのフィードバックをスクレイピングし、「これは壊れた」瞬間を生きた評価に変え、リリースするたびに新しいエッジケースを追加し続けています。 これはコミュニティ主導のQAループであり、失敗がベンチマークとなり、それがより良い結果になります。 あなたがクリエイターまたは PM の場合、これはテンプレートです: 公開フィードバック→評価→リリース→繰り返します。 @OfficialLoganK @nbrichtovaチーム全体で素晴らしい仕事をしました。
59.95K