Новая модель "OCR" от @deepseek_ai представляет собой стратегию сжатия на основе визуального восприятия, которая может изменить наше представление о обработке документов. В нашей последней статье @tuanacelik и @LoganMarkewich подробно рассматривают, что собой представляет эта новая модель и что она означает для будущих техник парсинга и LlamaParse👇 🔬 DeepSeek-OCR сжимает 1,000 текстовых токенов до всего лишь 100 визуальных токенов с точностью 97% - это 10-кратное сжатие при сохранении качества ❗ 1,000 сжатых текстовых токенов все еще довольно мало по сравнению с современными контекстными окнами LLM 🤖 Будущее, вероятно, объединит современные методы парсинга LLM с контекстным сжатием, таким как DeepSeek-OCR Читать наш полный обзор: