滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

DeepSeek開源Engram新架構：梁文鋒合著，或成V4核心技術基礎

時間：2026-01-13 07:23:58 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

人工智能領域迎來一項突破性進展，DeepSeek團隊在GitHub平臺開源了名為Engram的創新技術模塊，并同步發布題為《通過可擴展查找實現條件記憶：大語言模型稀疏性的新維度》的學術論文。這項研究通過解耦知識存儲與邏輯推理兩大核心功能，為提升模型效率開辟了全新路徑。

傳統大語言模型普遍采用Transformer與專家混合（MoE）架構，通過動態激活部分參數實現計算成本控制。但研究發現，現有架構在處理事實性記憶（如固定知識問答）與邏輯推理（如代碼調試）時存在顯著效率差異。以DeepSeek系列模型為例，盡管MoE架構有效緩解了參數量激增帶來的計算壓力，但在處理需要精確記憶的任務時仍存在優化空間。

Engram技術的核心創新在于構建了獨立的記憶處理通道。該模塊通過哈希算法將輸入文本切分為N-gram片段，并映射至可學習的查找表，實現O(1)時間復雜度的確定性檢索。這種設計使模型在保持參數規模的同時，將記憶存儲與邏輯計算徹底分離——靜態記憶通道負責快速檢索已知模式，動態計算通道專注處理復雜推理任務。

技術實現層面，Engram模塊被嵌入Transformer架構的早期階段。當輸入文本進入模型時，該模塊首先進行模式重建，將相關背景知識檢索出來作為后續計算的輸入素材。與傳統自注意力機制不同，這種條件化記憶檢索機制會根據上下文隱狀態動態調整檢索策略，確保提取的記憶片段與當前任務高度相關。

實驗數據顯示，在270億參數規模的測試模型中，Engram模塊可占用高達60%的參數用于記憶存儲，但在實際推理過程中僅消耗極少量計算資源。這種參數分配策略使模型在知識調用、數學推理等任務上的表現顯著提升，同時保持了與全參數模型相當的計算效率。研究團隊特別指出，Engram與MoE架構形成互補關系：前者處理記憶檢索的"已知已知"，后者專注邏輯推理的"未知未知"，二者協同構成更高效的雙系統架構。

技術社區對這項創新給予高度關注。Reddit平臺上的開發者討論指出，Engram通過引入靜態記憶維度，解決了MoE架構在模式重建方面的固有缺陷。有評論認為，這種確定性尋址機制使得模型可以將龐大記憶表卸載至主機內存，在幾乎不增加推理開銷的情況下擴展知識容量。另有開發者指出，該技術與傳統NLP中的n-gram嵌入存在理念相通之處，但通過現代化改造實現了質的飛躍。

關于技術落地，社區猜測Engram可能成為DeepSeek下一代模型的核心組件。X平臺上的技術分析認為，這種記憶-推理分離架構預示著大模型發展將進入新階段，未來可能出現更多針對特定任務優化的專業化模塊。有開發者調侃，這項來自中國團隊的創新或將改變行業技術路線，甚至引發新的"抄襲"競賽。

目前，Engram的完整代碼與論文已在GitHub公開，開發者可自由訪問實現細節。這項研究不僅為大模型架構設計提供了新思路，其開源特性也將推動整個領域的技術進步。隨著更多研究者參與優化，基于查算分離原理的新型模型架構有望在不久的將來實現更廣泛的應用突破。

更多>同類資訊

微信春節新玩法來襲！AI助力生成專屬拜年歌五音不全也能秀才藝

02-15

春節“科技警衛”上線！成都新銳警用裝備亮相，守護市民平安年

02-15

對話Teamily AI：拒絕極端，探尋人與AI共生的有溫度中間路線

02-15

AI與數學共舞：中國團隊攜PackingStar系統刷新親吻數多維度紀錄

02-15

武漢火車站“上崗”智能保潔員掃地機器人助力春運潔凈出行

上午9時，在武漢火車站西廣場，一款能夠自動清掃、自動充電、自動倒垃圾的掃地機器人被準時喚醒，它隨即自動“跑”到武漢火車站西廣場休閑區域，沿著設定的路線，進行保潔作業。保潔約40分鐘后，它自動回到基站自主充電…

02-15

蔡明春晚機器人小品30年蝶變：從齒輪轉動到情感共鳴的科技敘事

當蔡明在2026年春晚彩排現場與"機器人"續演《奶奶的最愛》時，沒人想到這個經典IP已橫跨三個十年。北京師范大學藝術與傳媒學院教授周星認為，這種變遷本質是科技倫理的啟蒙史——當小品里的機器人學會給奶奶蓋被子時…

02-15

廣汽馮興亞談行業挑戰：身處“四期疊加”關口，堅定變革謀發展

02-15

春運出行新體驗：充電升級、智能調度、文旅融合……科技點亮回家路

02-15

春運“科技范兒”十足：充電新招、交通調度、文旅融合齊上陣

02-15

宇樹科技王興興：具身智能尚處粗獷時代，未來熱度或遠超移動互聯網

02-15

蘋果“奪舍”法拉利

02-15

華為昇騰團隊高效適配MiniMax M2.5模型多現網局點試用助力技術落地

02-15

宇樹科技 CEO 王興興：具身智能時代的牛頓還沒誕生

02-15

廣汽馮興亞談行業變局：變革雖坎坷，銷量增長與戰略調整初顯成效

02-15

2026全球開發者先鋒大會啟幕在即，共筑AI產研融合創新新生態

02-15

點擊查看更多 +

全站最新

LONGWAY智能電動輪椅車：以科技之力，為老年人開啟便捷無憂出行新體驗

奔馳E300L三千公里實測：豪華體驗拉滿，但停車與油耗成甜蜜負擔

從H6到H9：哈弗新戰略下，硬派顏值與實力并重的新選擇來了

廣汽馮興亞談行業挑戰：身處“四期疊加”關口，堅定變革謀發展

年銷400萬仍被質疑“不夠高級”？比亞迪用實力書寫電車時代新篇章

2026年SUV市場盛宴來襲！10款新車3月起接踵而至滿足多元需求

熱門內容

本欄最新

廣汽馮興亞談行業挑戰：身處“四期疊加”關口，堅定變革謀發展

春運“科技范兒”十足：充電新招、交通調度、文旅融合齊上陣

客易云劇本改寫牽手數字人：AI賦能創作，開啟內容產業新想象

螞蟻開源萬億參數模型Ring-2.5-1T：架構創新破“不可能三角”，邏輯推理與速度雙飛躍

佟歐福全球財報會首秀定調在華戰略奔馳加速本土化三年推超40款新車

南方電網多舉措應對春運：建充電站增供給保出行暢無憂

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

DeepSeek開源Engram新架構：梁文鋒合著，或成V4核心技術基礎