Granite Docling by @IBM هو #3 يتجه على @huggingface. هذا نموذج متعدد الوسائط لتحويل النص إلى نص للصورة مصمم لتحويل المستندات بكفاءة. يحافظ على الميزات الأساسية ل Docling مع الحفاظ على التكامل السلس مع DoclingDocuments لضمان التوافق الكامل. إنه يعتمد على بنية IDEFICS3 ، ولكنه يقدم تعديلين رئيسيين: فهو يستبدل برنامج تشفير الرؤية ب siglip2-base-patch16-512 ويستبدل نموذج اللغة ب Granite 165M LLM. جرب عرضنا التوضيحي Granite-Docling-258 اليوم. الترخيص: Apache 2.0 تم دمج Granite-docling-258M بالكامل في خطوط أنابيب Docling ، حيث يحمل الميزات الحالية مع تقديم عدد من الميزات الجديدة القوية ، بما في ذلك: 🔢 التعرف على المعادلات المحسن: اكتشاف وتنسيق أكثر دقة للصيغ الرياضية 🧩 أوضاع الاستدلال المرنة: اختر بين استدلال الصفحة الكاملة واستدلال المنطقة الموجهة ب bbox 🧘 تحسين الاستقرار: يميل إلى تجنب الحلقات اللانهائية بشكل أكثر فعالية 🧮 المعادلات المضمنة المحسنة: التعرف على الرياضيات المضمنة بشكل أفضل 🧾 عنصر المستند ضمان الجودة: الإجابة على الأسئلة المتعلقة ببنية المستند مثل وجود عناصر المستند وترتيبها 🌍 دعم ياباني وعربي وصيني (تجريبي) صفحة HF: مبروك @ArvindKrishna @BillHiggins وفريق!