海光信息近日宣布,其自主研發的DCU(深度計算單元)已成功與上海人工智能實驗室旗下的OpenDataLab團隊和DeepLink團隊展開深度技術協作,完成了與智能文檔語料解析引擎MinerU的全棧適配工作。這一合作標志著海光在AI算力與數據處理領域的生態布局邁出關鍵一步。
據介紹,MinerU作為一款專注于非結構化文檔解析的智能引擎,能夠將各類復雜文檔轉化為AI模型可直接使用的結構化數據。通過與海光DCU的深度適配,該引擎在數據轉化效率上實現顯著提升,同時大幅降低了計算資源消耗,為AI訓練提供了更經濟、更高效的數據預處理方案。
此次技術突破得益于海光"自研AI軟件棧+開放生態"的戰略布局。海光DCU憑借其異構計算架構優勢,與MinerU的解析算法形成高效協同,在保持低延遲的同時,實現了對PDF、Office文檔、掃描件等多類型文件的精準解析。測試數據顯示,適配后的系統在處理速度上較傳統方案提升超過40%,能耗降低近30%。
上海人工智能實驗室相關技術負責人表示,此次合作構建了"算力+數據"的協同創新模式。海光DCU提供的強大底層算力支持,與MinerU在數據解析層面的技術優勢形成互補,為AI大模型訓練提供了從原始文檔到高質量訓練數據的完整解決方案,特別在金融、醫療、法律等文檔密集型行業具有廣泛應用前景。
目前,雙方已啟動下一階段合作計劃,將針對多模態文檔處理、實時解析等場景展開聯合研發。海光信息透露,其DCU生態已接入超過50家AI上下游企業,未來將持續通過開放合作模式,推動AI基礎設施技術的創新突破與應用落地。











