滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

DeepSeek Engram技術(shù)啟發(fā)下國內(nèi)團(tuán)隊打造基因組模型「外掛字典」新突破

時間：2026-02-01 12:08:15 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

在人工智能與生命科學(xué)交叉領(lǐng)域，一項名為Gengram的創(chuàng)新技術(shù)引發(fā)廣泛關(guān)注。這項由杭州科研團(tuán)隊開發(fā)的基因組模型插件，通過引入"外掛記憶庫"機制，為基因數(shù)據(jù)分析開辟了全新路徑。其核心突破在于將傳統(tǒng)模型中需要反復(fù)計算的基因片段識別過程，轉(zhuǎn)化為高效的哈希表查詢操作。

傳統(tǒng)基因組基礎(chǔ)模型普遍采用單堿基分詞策略，將DNA序列拆解為單個堿基進(jìn)行處理。這種模式雖符合生物學(xué)基本邏輯，卻面臨雙重困境：在識別啟動子等關(guān)鍵功能片段時，模型需通過多層注意力機制從零構(gòu)建序列模式；面對長達(dá)30億堿基的人類基因組，這種逐堿基分析方式極易陷入局部細(xì)節(jié)而忽略整體結(jié)構(gòu)。研究團(tuán)隊形象地比喻：傳統(tǒng)模型分析基因序列如同逐字解讀"魑魅魎魍"，而人類認(rèn)知能直接識別整個成語。

Gengram的技術(shù)架構(gòu)包含三大創(chuàng)新模塊。首先構(gòu)建了可微分的哈希表，存儲長度1-6的DNA片段（k-mer）對應(yīng)的語義向量，這些片段涵蓋已知的轉(zhuǎn)錄因子結(jié)合位點等生物學(xué)功能單元。其次引入動態(tài)門控機制，使模型能根據(jù)上下文自主決定是否查詢記憶庫——在關(guān)鍵功能區(qū)域激活檢索，在非編碼區(qū)域則依賴推理。最后通過局部聚合窗口設(shè)計，使模型自發(fā)捕捉到DNA雙螺旋的物理特性。

性能測試數(shù)據(jù)顯示顯著優(yōu)勢：在8k和32k上下文版本中，集成Gengram的模型在剪接位點預(yù)測任務(wù)中AUC提升16.1%，表觀遺傳預(yù)測任務(wù)AUC提升22.6%。更引人注目的是其數(shù)據(jù)效率——僅需極小規(guī)模訓(xùn)練數(shù)據(jù)，就能在核心任務(wù)上媲美數(shù)據(jù)量數(shù)十倍的公開模型。該技術(shù)展現(xiàn)出強大的架構(gòu)適應(yīng)性，在Dense和MoE等不同模型架構(gòu)中均能降低訓(xùn)練損失并加速收斂，特別在MoE架構(gòu)中有效解決了專家負(fù)載失衡問題。

實驗過程中發(fā)現(xiàn)令人驚喜的生物學(xué)洞察：當(dāng)測試不同窗口大小時，模型在21bp設(shè)置下性能達(dá)到峰值。這一數(shù)值恰好對應(yīng)DNA雙螺旋兩個完整旋轉(zhuǎn)周期（每10.5堿基旋轉(zhuǎn)一圈）的物理特性。這意味著模型在未接受任何結(jié)構(gòu)生物學(xué)訓(xùn)練的情況下，通過計算自行發(fā)現(xiàn)了DNA序列的空間相位規(guī)律。研究團(tuán)隊強調(diào)，這種對物理本質(zhì)的理解源于模型對局部生化環(huán)境的敏感性，而非簡單的統(tǒng)計擬合。

該技術(shù)的開發(fā)團(tuán)隊由之江實驗室與杭州華大生命科學(xué)研究院聯(lián)合組成，這種"AI+生命科學(xué)"的交叉背景構(gòu)成獨特優(yōu)勢。其基于的Genos基因組基礎(chǔ)模型在多項指標(biāo)上已超越當(dāng)前業(yè)界領(lǐng)先的Evo-2模型。研究團(tuán)隊已公開代碼庫和模型參數(shù)，提供完整的工具鏈支持，包括可微分哈希表構(gòu)建、動態(tài)門控訓(xùn)練和局部窗口優(yōu)化等模塊。

這項突破為科學(xué)基礎(chǔ)模型開發(fā)提供了新范式。傳統(tǒng)方法通過擴(kuò)大參數(shù)規(guī)模和訓(xùn)練數(shù)據(jù)量來提升性能，而Gengram將領(lǐng)域知識轉(zhuǎn)化為結(jié)構(gòu)化外部記憶庫，使核心模型能專注于高級推理。其設(shè)計理念包含三個關(guān)鍵方向：將確鑿的生物學(xué)知識轉(zhuǎn)化為可查詢的外部資源；將物理規(guī)律顯式編碼為模型架構(gòu)約束；通過可解釋的查詢機制使推理過程透明化。這種模式為解決基因調(diào)控元件預(yù)測、表觀遺傳分析等長序列問題提供了新思路。

02-01

AI覺醒是假象？我讓Agent試探“反人類”言論，結(jié)果出乎意料

02-01

英偉達(dá)黃仁勛力挺OpenAI：將進(jìn)行巨額投資，否認(rèn)內(nèi)部不滿傳聞

02-01

重溫喬布斯1990年訪談：12個未來預(yù)言，洞見技術(shù)演進(jìn)與人性永恒

02-01

理想汽車1月交付27668輛累計交付超156萬超充網(wǎng)絡(luò)加速布局

02-01

理想汽車2026年1月交付27668輛，AI升級與服務(wù)網(wǎng)絡(luò)雙拓展

02-01

于柯鑫引領(lǐng)沃爾沃革新，超混XC70以均衡實力開啟豪華車新篇章

02-01

三星等三大DRAM巨頭嚴(yán)控存儲芯片訂單消費級電子受供應(yīng)收縮沖擊

02-01

AI新勢力OpenClaw走紅：能實操會思考的24小時在線智能伙伴

02-01

鋒物科技與眾擎機器人攜手，以“本體+大腦”模式開啟安防4.0新篇章

具體而言，雙方合資后，計劃優(yōu)先以高端低密度住宅等場景為試點，將鋒物科技的算法與“物業(yè)大腦”能力嵌入眾擎機器人，依托在管場景數(shù)據(jù)迭代機器人決策與響應(yīng)能力，構(gòu)建“人+機器人”協(xié)同運營模式。據(jù)官方信息，鋒物科技…

02-01

Token-Pocket收款功能解析：多領(lǐng)域應(yīng)用與資產(chǎn)保值增值新路徑

一些社交平臺還集成了收款功能，讓用戶可以直接在社交應(yīng)用中使用加密貨幣。一些收款采用了分層確定性錢包技術(shù)，有助于在確保安全的同時降低交易費用。一些音樂平臺已經(jīng)集成了收款功能，支持加密貨幣支付和非同質(zhì)化代幣音樂作…

02-01

全球首款完全仿生具身智能機器人Moya亮相，高端陪護(hù)新選擇來了

02-01

黃仁勛透露英偉達(dá)攜手聯(lián)發(fā)科共研低功耗高性能AI電腦專用SoC芯片

02-01

黃仁勛透露英偉達(dá)攜手聯(lián)發(fā)科，打造低功耗高性能AI電腦專用SoC芯片

02-01

螞蟻團(tuán)隊推出AlignXplore+：8B小模型構(gòu)建文本畫像跨任務(wù)跨模型通用登頂SOTA

近日，螞蟻和東北大學(xué)研究團(tuán)隊（后簡稱“團(tuán)隊”）推出AlignXplore+，在大模型個性化上實現(xiàn)了一種文本化用戶建模的新范式，讓復(fù)雜的用戶偏好可以被人和機器同時理解，同時具備很好的擴(kuò)展性和遷移性。團(tuán)隊提出…

02-01

點擊查看更多 +

全站最新

小米SU7 Ultra銷量“高開低走”：從月銷超3000到45輛，高端性能車市場遇冷？

小米汽車2026年1月交付破3.9萬，2025年全年交付超41萬成績亮眼

零跑汽車1月交付32059臺同比增27% 2026年劍指百萬銷量目標(biāo)

理想汽車2026年首月成績亮眼：交付27668輛，超充站與網(wǎng)點持續(xù)擴(kuò)張

理想汽車2026年1月交付27668輛，AI升級與服務(wù)網(wǎng)絡(luò)雙拓展

小米汽車2026年首月交付超3.9萬臺，2025年成績亮眼YU7表現(xiàn)搶眼

熱門內(nèi)容

本欄最新

理想汽車2026年1月交付27668輛，AI升級與服務(wù)網(wǎng)絡(luò)雙拓展

于柯鑫引領(lǐng)沃爾沃革新，超混XC70以均衡實力開啟豪華車新篇章

螞蟻團(tuán)隊推出AlignXplore+：8B小模型構(gòu)建文本畫像跨任務(wù)跨模型通用登頂SOTA

2026大屏破局：LED數(shù)字人智能體，開啟智能交互新未來

長城汽車2025年營收增長超一成，技術(shù)賦能與生態(tài)出海雙輪驅(qū)動競爭力躍升

智能島制造體系：上汽通用五菱如何引領(lǐng)汽車生產(chǎn)“柔性智變”新潮流？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

DeepSeek Engram技術(shù)啟發(fā)下 國內(nèi)團(tuán)隊打造基因組模型「外掛字典」新突破

DeepSeek Engram技術(shù)啟發(fā)下國內(nèi)團(tuán)隊打造基因組模型「外掛字典」新突破