Granite Docling de @IBM es el #3 en tendencia en @huggingface. Este es un modelo multimodal de Imagen-Texto-a-Texto diseñado para una conversión de documentos eficiente. Preserva las características principales de Docling mientras mantiene una integración fluida con DoclingDocuments para asegurar una compatibilidad total. Se basa en la arquitectura IDEFICS3, pero introduce dos modificaciones clave: reemplaza el codificador de visión con siglip2-base-patch16-512 y sustituye el modelo de lenguaje por un Granite 165M LLM. Prueba nuestra demostración Granite-Docling-258 hoy. Licencia: Apache 2.0 Granite-docling-258M está completamente integrado en los pipelines de Docling, conservando las características existentes mientras introduce una serie de potentes nuevas características, incluyendo: 🔢 Reconocimiento de Ecuaciones Mejorado: Detección y formateo más precisos de fórmulas matemáticas 🧩 Modos de Inferencia Flexibles: Elige entre inferencia de página completa, inferencia de región guiada por bbox 🧘 Estabilidad Mejorada: Tiende a evitar bucles infinitos de manera más efectiva 🧮 Ecuaciones Inline Mejoradas: Mejor reconocimiento de matemáticas en línea 🧾 QA de Elementos de Documentos: Responde preguntas sobre la estructura de un documento, como la presencia y el orden de los elementos del documento 🌍 Soporte para japonés, árabe y chino (experimental) Página de HF: ¡Felicidades @ArvindKrishna @BillHiggins y equipo!