المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
اليوم ، حققنا في @OpenAI إنجازا اعتبره الكثيرون بعد سنوات: الأداء على مستوى الميدالية الذهبية في المنظمة البحرية الدولية لعام 2025 مع LLM للمنطق العام - تحت نفس الحدود الزمنية مثل البشر ، بدون أدوات. على الرغم من أن هذا يبدو رائعا ، إلا أنه أكثر أهمية من العنوان 🧵 الرئيسي

19 يوليو 2025
1 / N أنا متحمس لمشاركة أن أحدث @OpenAI المنطق التجريبي لدينا قد حقق تحديا كبيرا طويل الأمد في الذكاء الاصطناعي: أداء على مستوى الميدالية الذهبية في مسابقة الرياضيات الأكثر شهرة في العالم - أولمبياد الرياضيات الدولي (IMO).

عادة بالنسبة لنتائج الذكاء الاصطناعي هذه ، كما هو الحال في Go / Dota / Poker / Diplomacy ، يقضي الباحثون سنوات في صنع الذكاء الاصطناعي الذي يتقن مجالا ضيقا ولا يفعل شيئا آخر. لكن هذا ليس نموذجا خاصا بالمنظمة البحرية الدولية. إنه ماجستير في المنطق يشتمل على تقنيات تجريبية جديدة للأغراض العامة.
إذن ما هو المختلف؟ لقد طورنا تقنيات جديدة تجعل LLMs أفضل بكثير في المهام التي يصعب التحقق منها. كانت مشاكل المنظمة البحرية الدولية هي التحدي المثالي لهذا: البراهين عبارة عن صفحات طويلة وتستغرق ساعات من الخبراء لتصنيفها. قارن ذلك ب AIME ، حيث تكون الإجابات مجرد عدد صحيح من 0 إلى 999.
كما أن هذا النموذج يفكر لفترة * طويلة *. O1 فكرت لثوان. بحث عميق لدقائق. هذا يفكر لساعات. الأهم من ذلك ، أنها أيضا أكثر كفاءة في تفكيرها. وهناك مجال كبير لدفع حوسبة وقت الاختبار والكفاءة إلى أبعد من ذلك.

13 سبتمبر 2024
يفكر O1 @OpenAI @rao2z @OpenAI لثوان ، لكننا نهدف إلى أن تفكر الإصدارات المستقبلية لساعات أو أيام أو حتى أسابيع. ستكون تكاليف الاستدلال أعلى ، ولكن ما هي التكلفة التي ستدفعها مقابل دواء جديد للسرطان؟ للبطاريات المتطورة؟ لإثبات فرضية ريمان؟ يمكن أن يكون الذكاء الاصطناعي أكثر من مجرد روبوتات محادثة

يجدر التفكير في مدى سرعة تقدم الذكاء الاصطناعي ، خاصة في الرياضيات. في عام 2024 ، كانت مختبرات الذكاء الاصطناعي تستخدم الرياضيات في المدرسة الابتدائية (GSM8K) كدليل في إصدارات النماذج الخاصة بها. منذ ذلك الحين ، قمنا بإشباع معيار الرياضيات (المدرسة الثانوية) ، ثم AIME ، والآن في IMO Gold.
أين يذهب هذا؟ بالسرعة التي أحرزها الذكاء الاصطناعي مؤخرا ، أتوقع تماما أن يستمر الاتجاه. الأهم من ذلك ، أعتقد أننا قريبون من الذكاء الاصطناعي الذي يساهم بشكل كبير في الاكتشاف العلمي. هناك فرق كبير بين الذكاء الاصطناعي أقل بقليل من الأداء البشري الأعلى مقابل أعلى قليلا.
كان هذا جهدا جماعيا صغيرا بقيادة @alexwei_. أخذ فكرة بحثية قلة يؤمن بها واستخدمها لتحقيق نتيجة أقل من الفكر الممكن. لن يكون هذا ممكنا أيضا بدون سنوات من البحث + الهندسة من العديد من @OpenAI ومجتمع الذكاء الاصطناعي الأوسع.
عندما تعمل في مختبر حدودي ، فإنك تعرف عادة أين توجد القدرات الحدودية قبل أي شخص آخر بشهور. لكن هذه النتيجة جديدة تماما ، باستخدام تقنيات مطورة مؤخرا. لقد كانت مفاجأة حتى للعديد من الباحثين في OpenAI. اليوم ، يمكن للجميع رؤية مكان الحدود.
1.07M
الأفضل
المُتصدِّرة
التطبيقات المفضلة