Saya baru saja mendengarkan rincian Gemini melompat dari 2.0 ke 2.5, dan inilah intinya. Tim tidak hanya mengandalkan tes laboratorium. Mereka mengikis umpan balik pengguna nyata dari X, mengubah momen "ini bangkrut" menjadi eval hidup, dan terus menambahkan casing tepi baru dengan setiap rilis. Ini adalah lingkaran QA yang digerakkan oleh komunitas: kegagalan kami menjadi tolok ukur mereka, yang menjadi hasil kami yang lebih baik. Jika Anda seorang kreator atau PM, ini adalah templat: umpan balik publik → evals → rilis → ulang. Kerja hebat @OfficialLoganK @nbrichtova dan seluruh tim.
59,95K