Нова модель «OCR» від @deepseek_ai представляє стратегію стиснення, засновану на баченні, яка може змінити наше уявлення про обробку документів. У нашій останній статті @tuanacelik і @LoganMarkewich глибоко занурюємося в те, що являє собою ця нова модель, і що вона означає для майбутніх методів парсингу та LlamaParse👇
🔬 DeepSeek-OCR стискає 1 000 текстових токенів до лише 100 токенів зору з точністю 97% - це 10-кратне стиснення, зберігаючи якість
❗ 1 000 токенів стисненого тексту – це все ще досить мало в порівнянні з сучасними контекстними вікнами LLM
🤖 Майбутнє, ймовірно, поєднує сучасний парсинг LLM зі стисненням контексту, як DeepSeek-OCR
Читайте наш повний текст:
🚀 LlamaClassify, наш найсучасніший сервіс класифікації агентських документів, тепер доступний для використання також у TypeScript SDK:
' npm install llama-cloud-services@latest '
💻 Якщо ви хочете спробувати це, погляньте на нашу демонстрацію @tan_stack + @daisyui_ для класифікації фінансових документів:
📚 Дізнайтеся більше про LlamaClassify:
🦙 Зареєструйтесь у LlamaCloud: