滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內容

DeepSeek-OCR 2革新登場：視覺編碼升級，文檔識別性能與穩定性雙提升

時間：2026-01-27 19:07:33 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

文檔識別領域迎來重要進展，DeepSeek團隊正式推出新一代文檔識別模型DeepSeek-OCR 2。該模型在繼承前代架構優勢的基礎上，通過創新性的視覺編碼器設計，實現了對復雜文檔結構更精準的解析能力。

傳統視覺語言模型在處理文檔圖像時，通常采用固定柵格順序切割視覺元素，這種處理方式雖便于實現，卻與人類閱讀時的語義跳躍特性存在顯著差異。特別是在學術論文、財務報表等版式復雜的場景中，視覺元素間的邏輯關聯往往超越空間位置關系，單純依賴空間順序的解析方式容易產生理解偏差。

研究團隊提出的DeepEncoder V2架構突破了這一局限。該架構通過引入"視覺因果流"機制，使編碼器能夠動態調整視覺token的處理順序。具體實現上，系統同時運行雙向注意力與因果注意力兩種模式：前者負責全局視覺信息感知，后者通過可學習的因果查詢token逐步構建語義順序。這種雙重注意力機制確保模型在編碼階段就能完成視覺元素的智能排序。

在架構設計方面，新模型延續了編解碼框架但進行了關鍵優化。編碼器先將圖像壓縮為256-1120個視覺token，經DeepEncoder V2重組語義順序后，交由基于混合專家架構（MoE）的語言模型解碼。這種設計在保持計算效率的同時，將解碼負擔控制在合理范圍內，資源消耗與前代模型基本持平。

性能驗證在OmniDocBench v1.5基準測試中進行，該測試集包含中英文學術論文、商業報告等12類文檔。實驗數據顯示，在視覺token數量減少的情況下，新模型整體識別準確率達91.09%，較前代提升3.73個百分點。特別在閱讀順序指標上，編輯距離從0.085優化至0.057，證明其對文檔結構的理解能力顯著增強。

實際應用表現同樣亮眼。生產環境測試顯示，在線用戶日志圖像的重復識別率下降33%（從6.25%降至4.17%），PDF批處理數據的重復率降低22%（從3.69%降至2.88%）。這些改進表明模型在保持高壓縮率的同時，有效提升了復雜場景下的處理穩定性。

更多>同類資訊

美國FBI預警：黑客利用ATM漏洞部署惡意軟件，一年竊取超2000萬美元

02-20

土星環與土衛六起源或有新解：數億年前衛星碰撞造就今日奇觀

02-20

土衛六與土星環或源于衛星大碰撞未來十年“蜻蜓號”或揭秘

02-20

我國科學家突破“帶寬鴻溝” 新系統刷新光通信與6G融合傳輸速率紀錄

新華社北京2月19日電（記者魏夢佳）我國科學家近日在光通信和6G領域取得突破性進展，在國際上率先實現光纖通信和無線通信系統間的跨網絡融合，自主研發的“光纖—無線一體化融合通信系統”的數據傳輸速率刷新紀錄。王…

02-20

港股異動丨發盈喜，速騰聚創大漲超15%

02-20

港股異動丨存儲概念走強，南方兩倍做多海力漲近6%，南方兩倍做多三星漲近4%

02-20

美國加州雪崩致9名滑雪者死亡

02-20

璋利國際創歷史新高

02-20

港股異動丨春晚機器人出圈，相關概念股集體大漲，優必選漲近9%

02-20

古巴外長：美經濟封鎖致古巴一年損失超70億美元

02-20

港股異動丨石油股逆勢走強，中國石油股份漲超4%

02-20

OpenAI創始人：超級智能將能夠勝任一家大型公司的CEO，比任何高管都做得更好，包括我自己

02-20

春節假期迎返程客流攀升國鐵廣州局預計20日到達旅客突破200萬人次

02-20

有中國公民在街頭遇襲我駐奧克蘭總領館：嚴重關切

02-20

美元指數突破98

02-20

點擊查看更多 +

全站最新

職場溝通新利器：三款耳機大比拼，哪款能讓你會議溝通更高效？

雙11耳機選購指南：森海塞爾與科大訊飛，哪款更適合你的生活節奏？

港股異動丨發盈喜，速騰聚創大漲超15%

港股異動丨存儲概念走強，南方兩倍做多海力漲近6%，南方兩倍做多三星漲近4%

港股異動丨春晚機器人出圈，相關概念股集體大漲，優必選漲近9%

港股異動丨石油股逆勢走強，中國石油股份漲超4%

熱門內容

本欄最新

港股異動丨發盈喜，速騰聚創大漲超15%

港股異動丨存儲概念走強，南方兩倍做多海力漲近6%，南方兩倍做多三星漲近4%

港股異動丨春晚機器人出圈，相關概念股集體大漲，優必選漲近9%

港股異動丨石油股逆勢走強，中國石油股份漲超4%

港股三大指數低開

港股異動丨速騰聚創逆勢高開超4%，預計首次實現單季度盈利6000萬

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

DeepSeek-OCR 2革新登場：視覺編碼升級，文檔識別性能與穩定性雙提升