@IBM の Granite Docling は、@huggingface で #3 のトレンドです。 これは、効率的なドキュメント変換のために設計されたマルチモーダルな画像-テキストからテキストへのモデルです。Doclingのコア機能を維持しながら、DoclingDocumentsとのシームレスな統合を維持し、完全な互換性を確保します。 IDEFICS3 アーキテクチャに基づいて構築されていますが、ビジョン エンコーダーを siglip2-base-patch16-512 に置き換え、言語モデルを Granite 165M LLM に置き換えるという 2 つの重要な変更が導入されています。今すぐ Granite-Docling-258 のデモをお試しください。 ライセンス: Apache 2.0 Granite-docling-258M は Docling パイプラインに完全に統合されており、既存の機能を引き継ぎながら、次のような多くの強力な新機能を導入しています。 🔢 方程式認識の強化: 数式のより正確な検出と書式設定 🧩 柔軟な推論モード: ページ全体の推論、bbox ガイド付き領域推論から選択 🧘 安定性の向上: 無限ループをより効果的に回避する傾向があります 🧮 強化されたインライン方程式: インライン数学認識の向上 🧾 ドキュメント要素の QA: ドキュメント要素の存在や順序など、ドキュメントの構造に関する質問に答えます 🌍 日本語、アラビア語、中国語のサポート(実証) HFページ: おめでとうございます@ArvindKrishna @BillHigginsチーム!