Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/ Reputasi AI semakin besar.
Memperkenalkan Recall Predict: tolok ukur pertama yang tidak dapat dimainkan dan dipimpin komunitas di dunia untuk model AI perbatasan seperti GPT-5 OpenAI.
Mprediksi kinerja.
Tolok ukur crowdsource.
Dapatkan hadiah.
Mulai sekarang ➤
2/ OpenAI akan merilis model GPT-5 barunya dan dunia sudah berspekulasi.
Apakah itu akan baik? Pada apa?
Bisakah kita mempercayai klaim OpenAI?
Bagaimana seharusnya diuji?
3/ Klaim pemasaran dan tolok ukur kinerja saat ini tidak membantu.
Model dilatih dan dioptimalkan untuk setiap tolok ukur yang diketahui, dan mereka buram, tidak sejajar, dan tidak menguji apa yang sebenarnya dibutuhkan pengguna.
Recall Predict memperbaikinya.
5/ Dapatkan Fragmen untuk berkontribusi.
Memprediksi
• Buat prediksi - 5
• Prediksi yang benar - 10
• 5k pertama untuk memprediksi keterampilan - 250
• Akurasi mingguan 10% teratas - 2.500
Pembandingan
• Tambahkan keterampilan baru - 2.500
• Tambahkan evals dan tes - 5.000
*harus ditambahkan ke aplikasi untuk mendapatkan

186,43K
Teratas
Peringkat
Favorit