@deepseek_ai 的新 "OCR" 模型代表了一種基於視覺的壓縮策略,可能會改變我們對文檔處理的看法。在我們最新的文章中,@tuanacelik 和 @LoganMarkewich 深入探討了這個新模型是什麼,以及它對未來解析技術和 LlamaParse 的意義👇 🔬 DeepSeek-OCR 將 1,000 個文本標記壓縮到僅 100 個視覺標記,準確率達到 97% - 這是 10 倍的壓縮,同時保持質量 ❗ 1,000 個壓縮的文本標記與現代 LLM 上下文窗口相比仍然相當小 🤖 未來可能會將當今現代 LLM 解析與像 DeepSeek-OCR 這樣的上下文壓縮結合起來 閱讀我們的完整看法: