المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
فقط اقرأ الورقة ، وقبل كل شيء ، إنها ورقة جيدة! لقد ذهبوا بالفعل وقاموا بتدريب مسبق على طول الطريق إلى ما بعد التدريب النهائي. النماذج صغيرة ولكن بالمقارنة مع تريليون رمز مميز ، فإن بيانات الخلية الواحدة ليست بهذا الحجم. كان الاحتفاظ بقوس النموذج ذكيا. لكن... هذا هو الشيء. إنه ليس تحولا كبيرا في كيفية قيام المجال بالأشياء. ولا إظهار القدرات الجديدة أو تحول نموذجي في الدقة / الاستدعاء. حقيقة كل ذلك هي أن بيانات التعبير الجيني ، حتى على مستوى الخلية الواحدة ، لها حدودها. ستأتي معظم الإشارة من جينات معبر عنها بشكل تفاضلي: من المحتمل ألا تحتاج إلى القيام ب LLMs لهذا لاستخراج فرضيات جيدة. إذن هذا تقدم تدريجي.
ولكن ، لنفترض أن هناك بعض الإشارات المخفية التي لا يمكن استخراجها إلا مع السياق ذي الصلة ، مما يجعلها مثالية ل LLMs. افترض أنك أنشأت نموذجا تعتقد أنه يمكنه استخراج هذه المعلومات. السؤال الرئيسي هو: كيف تختبر هذا على نطاق واسع؟ كيف يمكنني التحقق من أن هذا النموذج يجد أشياء مثيرة للاهتمام لم أتمكن من العثور عليها باستخدام طرق أبسط؟ هذا هو التحدي الحقيقي ومجرد إجراء عدد قليل من التجارب لن يثبت ذلك.
لنفترض أنك أجريت تجارب التحقق من الصحة هذه على نطاق واسع ، وتنفق الكثير من $ $ ، وتنتظر عدة أشهر ... وأنت تدرك أن النموذج ليس جيدا مقارنة بخط الأساس كما كنت تعتقد ، ماذا الآن؟ هل تقوم بجولة أخرى من التدريب التجريبي على نطاق واسع وتكرر؟ هذه غالية! إنها أغلى بكثير من أشياء LLM القياسية حيث يمكنك ELO / ترتيب طريقك في ساحات الدردشة وبيانات المستخدم.
و * هذا * هو السبب في أن تحريك الإبرة في علم الأحياء أمر صعب للغاية. حلقة التغذية الراجعة التجريبية تقتلك فقط. وإذا كنت تصمم علاجات؟ تصبح الحلقة أطول ، سنوات أو عقودا حتى إذا كنت ترغب في قياس نقاط النهاية الحقيقية.
هذا هو الدرس المرير في علم الأحياء: الفحص هو الملك، بجانب السرير هو الملك - الأساليب الحسابية ستأخذك فقط حتى الآن دون التحقق من صحة تجريبية مكثفة. أنا أؤمن في قلبي أن هناك بعيدا حول هذا ، لكن من يكسر هذا الرمز يفوز.
الأفضل
المُتصدِّرة
التطبيقات المفضلة

