滾動資訊

當(dāng)前位置：首頁 > 資訊 > 信息流 > 正文內(nèi)容

DeepSeek R1發(fā)布一周年之際，神秘Model1現(xiàn)身或為V4前奏？

時間：2026-01-21 17:43:35 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

近期，開源社區(qū)因DeepSeek的一項新動向掀起熱議。其FlashMLA代碼庫頻繁更新，一款名為Model1的模型悄然進(jìn)入公眾視野，引發(fā)關(guān)于DeepSeek下一代旗艦?zāi)Ｐ偷牟聹y。結(jié)合代碼變更與社區(qū)分析，這款神秘模型的技術(shù)細(xì)節(jié)逐漸浮出水面。

在代碼庫的分支結(jié)構(gòu)中，Model1與DeepSeek-V3.2并列存在，形成獨(dú)立的技術(shù)路徑。這一布局暗示其并非V3系列的迭代補(bǔ)丁，而是基于全新架構(gòu)的工程版本。技術(shù)專家通過解析代碼差異發(fā)現(xiàn)，Model1在核心參數(shù)設(shè)計上與V3系列存在顯著差異，例如將MLA架構(gòu)的head_dim從576維調(diào)整為512維。這種“標(biāo)準(zhǔn)化”回歸可能旨在優(yōu)化與NVIDIA Blackwell架構(gòu)的算力匹配，同時提升Latent壓縮效率。

硬件適配層面，代碼庫新增大量針對Blackwell GPU的優(yōu)化模塊。例如，api.cpp文件中出現(xiàn)的FMHACutlassSM100FwdRun接口，直接指向下一代GPU的核心指令集。根據(jù)運(yùn)行環(huán)境說明，Model1在B200芯片上需CUDA 12.9支持，其Sparse MLA算子已實現(xiàn)350 TFlops的初步性能，而H800芯片上的Dense MLA吞吐量則高達(dá)660 TFlops。這種跨代硬件的針對性優(yōu)化，進(jìn)一步印證了Model1的旗艦定位。

算子創(chuàng)新是Model1最突出的技術(shù)突破。測試腳本顯示，該模型同時支持Sparse與Dense兩種解碼模式，其中Sparse路徑采用FP8精度存儲KV Cache，計算時動態(tài)切換至bfloat16以保證精度。這種混合精度設(shè)計可顯著降低長文本推理的顯存占用，同時維持計算效率。社區(qū)推測，此特性或使Model1在處理超長上下文時具備優(yōu)勢。

代碼注釋中隱現(xiàn)的兩大新機(jī)制引發(fā)關(guān)注。首先是Value Vector Position Awareness（VVPA），該技術(shù)可能通過增強(qiáng)位置編碼的動態(tài)適應(yīng)性，解決傳統(tǒng)MLA架構(gòu)在長文本中的信息衰減問題。其次是Engram機(jī)制，盡管具體實現(xiàn)未完全公開，但結(jié)合分布式存儲相關(guān)的代碼邏輯，其或為KV Cache壓縮提供的全新解決方案，與Model1的高吞吐需求形成技術(shù)閉環(huán)。

目前，DeepSeek尚未對Model1的官方身份作出回應(yīng)。但技術(shù)社區(qū)普遍認(rèn)為，從架構(gòu)參數(shù)、硬件適配到算子設(shè)計，Model1均展現(xiàn)出跨越V3系列的技術(shù)特征。按照DeepSeek的版本命名慣例，V3.2之后的架構(gòu)代際升級，極有可能以V4命名。這款神秘模型是否會成為春節(jié)前后的技術(shù)驚喜，仍需等待官方確認(rèn)。

01-31

《心之眼》開發(fā)商與IO Interactive終止合作聯(lián)動計劃擱淺專注修復(fù)更新

01-31

游戲主播直播遇驚魂：RTX 4090顯卡供電接口冒煙熔毀引關(guān)注

01-31

中國“人造太陽”實現(xiàn)億度千秒突破開啟終極清潔能源新紀(jì)元

這個被稱為"人造太陽"的東方奇跡，正在改寫人類能源史。在安徽合肥科學(xué)島上，直徑8米的EAST裝置正閃耀著人類智慧的光芒。近百萬個零部件協(xié)同運(yùn)轉(zhuǎn)，2000余項專利支撐，中國科學(xué)家用20年時間完成了西方同行半個…

01-31

量子計算新突破！“莊子2.0”芯片揭示預(yù)熱化規(guī)律助力信息保存

中國科學(xué)院物理研究所聯(lián)合北京大學(xué)等組成的科研團(tuán)隊，通過在超導(dǎo)芯片“莊子2.0”上進(jìn)行實驗，發(fā)現(xiàn)了量子系統(tǒng)的預(yù)熱化階段和可控規(guī)律，有望進(jìn)一步理解和控制高度復(fù)雜的量子世界。量子系統(tǒng)在演化過程中，如果熱化…

01-31

新恒匯業(yè)務(wù)拓展成效顯著芯片封測成新增長極獲機(jī)構(gòu)增持評級

在物聯(lián)網(wǎng)eSIM芯片封測領(lǐng)域，公司推出了物聯(lián)網(wǎng)QFN/DFN封裝、MP2封裝等新產(chǎn)品或服務(wù)，目前下游客戶已成功覆蓋紫光同芯等芯片設(shè)計廠商及中移物聯(lián)等物聯(lián)網(wǎng)廠商。2024年上述兩項新業(yè)務(wù)合計貢獻(xiàn)營收2.42億元…

01-31

從農(nóng)家少年到星空探索者：湯博發(fā)現(xiàn)冥王星，骨灰隨探測器遨游宇宙

01-31

煙臺蓬萊孫陶遺址：解鎖膠東史前密碼探尋大汶口到龍山文化脈絡(luò)

01-31

中國助力！長征二號丙火箭成功送阿爾及利亞遙感三號衛(wèi)星B星入軌

01-31

極寒天氣“攪局” 美航天局調(diào)整“阿耳忒彌斯2號”載人繞月計劃

01-31

微博2025社區(qū)信任報告：清謠言、反詐騙，多元共治筑牢信任防線

01-31

上海交大攜手海立集團(tuán) 打造先進(jìn)熱管理技術(shù)全鏈條創(chuàng)新體系

01-31

上海交大攜手海立集團(tuán) 共筑先進(jìn)熱管理技術(shù)全鏈條創(chuàng)新體系

01-31

斯塔默轉(zhuǎn)抵上海：用筷子經(jīng)驗豐富，家中有LABUBU

01-31

12VHPWR噩夢未散：游戲主播親歷RTX 4090顯卡冒煙現(xiàn)場

01-31

點擊查看更多 +

全站最新

一汽解放J6平臺達(dá)200萬銷量里程碑全新J6 PRO攜智慧節(jié)能優(yōu)勢登場

2026年一汽大眾戰(zhàn)略升級：燃油與智能并進(jìn)，多款新車蓄勢待發(fā)

純電SUV顏值大比拼：從極簡到豪華，哪款設(shè)計戳中你的心？

二手車怕踩坑？4種實用過戶信息查詢法，新手輕松掌握購車關(guān)鍵！

東風(fēng)奕派2026年牽手華為：多款“滿血華為”新車即將交付，A0級市場也有新動作

專供中東市場！捷尼賽思G80 Magma高性能轎車確認(rèn)量產(chǎn)，全球僅20輛

熱門內(nèi)容

本欄最新

H5定制開發(fā)全流程解析：從需求對接到售后保障的完整指南

東芝超導(dǎo)電機(jī)攜手氫動力：開啟航空零排放新紀(jì)元，共赴綠色飛行未來

瑪莎拉蒂M(fèi)CPura Cielo“冰與火”限定版亮相，專屬定制盡顯獨(dú)特魅力

松下推出《生化危機(jī)：安魂曲》聯(lián)名頸掛揚(yáng)聲器，獨(dú)特設(shè)計加“恐怖模式”調(diào)音

美股三大指數(shù)收盤集體下跌，納指收跌0.94%，中概指數(shù)大跌2.36%

吳向東榮膺"2025十大經(jīng)濟(jì)年度人物"

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

DeepSeek R1發(fā)布一周年之際，神秘Model1現(xiàn)身或為V4前奏？