Granite Docling od @IBM jest na #3 miejscu w trendach na @huggingface. To multimodalny model Image-Text-to-Text zaprojektowany do efektywnej konwersji dokumentów. Zachowuje kluczowe cechy Docling, jednocześnie zapewniając płynne połączenie z DoclingDocuments, aby zapewnić pełną kompatybilność. Opiera się na architekturze IDEFICS3, ale wprowadza dwie kluczowe modyfikacje: zastępuje enkoder wizji siglip2-base-patch16-512 i zamienia model językowy na Granite 165M LLM. Wypróbuj naszą dzisiejszą wersję demonstracyjną Granite-Docling-258. Licencja: Apache 2.0 Granite-docling-258M jest w pełni zintegrowany z pipeline'ami Docling, przenosząc istniejące funkcje, jednocześnie wprowadzając szereg potężnych nowych funkcji, w tym: 🔢 Ulepszona rozpoznawalność równań: Bardziej dokładne wykrywanie i formatowanie wzorów matematycznych 🧩 Elastyczne tryby wnioskowania: Wybierz między wnioskowaniem na pełnej stronie a wnioskowaniem w regionach z wykorzystaniem bbox 🧘 Ulepszona stabilność: Skuteczniej unika nieskończonych pętli 🧮 Ulepszona inline math: Lepsze rozpoznawanie równań w tekście 🧾 QA elementów dokumentu: Odpowiedz na pytania dotyczące struktury dokumentu, takie jak obecność i kolejność elementów dokumentu 🌍 Wsparcie dla japońskiego, arabskiego i chińskiego (eksperymentalne) Strona HF: Gratulacje @ArvindKrishna @BillHiggins i zespole!