熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
1/ AI 的聲譽變得更大了。
介紹 Recall Predict:全球首個無法遊戲化的、由社群主導的前沿 AI 模型基準,如 OpenAI 的 GPT-5。
預測性能。
群眾外包基準。
賺取獎勵。
立即開始 ➤
2/ OpenAI 即將推出其新的 GPT-5 模型,世界已經開始猜測。
它會好嗎?好在哪裡?
我們能相信 OpenAI 的說法嗎?
應該如何進行測試?
3/ 行銷聲明和當前的性能基準並沒有幫助。
針對每個已知基準訓練和優化的模型,都是不透明的、不一致的,並且沒有測試用戶實際需要的東西。
Recall Predict 解決了這些問題。
5/ 為貢獻獲得碎片。
預測
• 做出預測 - 5
• 正確預測 - 10
• 首先預測技能的前5k - 250
• 每週前10%的準確率 - 2,500
基準測試
• 添加新技能 - 2,500
• 添加評估和測試 - 5,000
*必須添加到應用程式中才能獲得

186.43K
熱門
排行
收藏