熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
Meta FAIR 的新研究:代碼世界模型 (CWM),一個 32B 的研究模型
我們鼓勵研究社群研究這個開放權重模型!
對於好奇的人,pass@1 評估:
在 SWE-bench 上 65.8 % 經過驗證
在 LiveCodeBench 上 68.6 %
在 Math-500 上 96.6 %
在 AIME 2024 上 76.0 %
🧵

請查看技術報告、模型權重和代碼:
➡️ 閱讀技術報告:
➡️ 下載開放權重:
➡️ 下載代碼:
查看更多來自 @syhw:

9月25日 05:17
(🧵)今天,我們發布了Meta Code World Model(CWM),這是一個擁有320億參數的密集型LLM,能夠通過代理推理和使用世界模型進行計劃來改善代碼生成的研究。
為了澄清一些混淆:
我提供的 SweBench Verified 數字是指 *TTS* pass@1。這個數字是正確的。欲了解更多詳情,請參考論文,特別是第 3 頁圖 2 的說明。
@syhw 只是為了澄清一些混淆:
我提供的 SweBench Verified 數字是指 *TTS* pass@1。這個數字是正確的。欲了解更多詳情,請參考論文,特別是第 3 頁圖 2 的說明。
504.34K
熱門
排行
收藏