滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

DeepSeek V4基準測試引熱議，編程能力或超頂尖閉源模型，明日發布？

時間：2026-02-17 08:29:08 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

近日，一款名為DeepSeek V4的開源大模型引發AI圈熱議。有消息稱，該模型或將于春節期間正式發布，其編程能力、上下文處理能力等多項指標均達到行業頂尖水平，甚至被部分網友稱為“首個能匹敵頂尖閉源模型的開源模型”。

據泄露的基準測試數據，DeepSeek V4在SWE-bench Verified測試中取得了83.7%的成績，超越了Claude Opus 4.5（80.9%）和GPT-5.2（80%）。這一成績若被證實，將直接改寫當前“最強代碼模型”的排名。該模型在AIME 2026、IMO Answer Bench等數學推理測試中也表現出色，分別取得99.4%和88.4%的高分，甚至在FrontierMath Tier 4測試中達到GPT-5.2的11倍成績。

除了編程和數學能力，DeepSeek V4的上下文處理能力同樣引人注目。有傳聞稱，該模型支持高達100萬token的上下文長度，并引入了新的Engram條件存儲系統，能夠實現近乎無限的上下文檢索。這一特性使其在處理大型代碼庫或復雜分布式系統時更具優勢，能夠理解代碼庫中文件變化對其他部分的影響，為企業級開發提供強大支持。

然而，隨著消息的傳播，部分基準測試數據的真實性也受到質疑。有業內人士指出，在官方評分系統下，模型不可能達到99.4%的分數，最高分應為100%或99.2%。Epoch AI也確認，FrontierMath的數據存在偽造嫌疑，因為只有他們和OpenAI有權對該數據集進行評估。這些質疑使得DeepSeek V4的真實性能蒙上一層陰影。

盡管如此，DeepSeek V4的發布仍被視為開源模型領域的一次重要突破。此前，DeepSeek的V3和R1模型已證明開源AI模型能夠以極低成本與專有模型競爭，而V4則有望在此基礎上進一步提升開源模型的競爭力。據透露，V4在訓練過程中對數據模式的理解能力得到提升，且不易出現性能衰減，輸出結果在邏輯上也更加嚴密和可靠。

目前，DeepSeek官方尚未對V4的發布時間和具體性能作出正式回應，但業內普遍猜測，該模型可能正在測試一個輕量級版本（V4-lite），以逐步釋放其技術潛力。與此同時，Hugging Face、GitHub等平臺上仍未出現DeepSeek V4的相關更新，進一步加劇了外界對其真實性的猜測。

無論DeepSeek V4的最終性能如何，其引發的討論已充分說明開源模型在AI領域的影響力正在不斷擴大。隨著技術的不斷進步，開源與閉源模型之間的競爭或將更加激烈，而用戶也將從中獲得更多選擇和更高質量的AI服務。

更多>同類資訊

OpenAI 正式發布 ChatGPT 的蘋果 CarPlay 適配版本

04-01

算力本地化：Speechify 推出原生 Windows 應用挑戰系統級聽寫

04-01

ChatGPT 悄然“上車”！OpenAI 適配蘋果 CarPlay：能動嘴絕不動手，但還是不能幫你看車

04-01

OpenAI 宣布完成 1220 億美元巨額融資，投后估值升至 8520 億美元

04-01

?協同辦公 AI 化：Salesforce 宣布對 Slack 進行 30 項深度功能改造

04-01

營收凈利雙創新高！美的集團 2025 年報出爐：擬投 600 億深化AI布局

04-01

AI獨角獸Mercor確認遭攻擊:開源項目LiteLLM被植入惡意代碼

04-01

Anthropic 回應 Claude Code 源碼泄露：自動化程度仍需提高

04-01

古爾曼：蘋果iOS 27輸入法升級AI糾錯功能，能根據上下文推薦更貼切詞匯

04-01

智譜一邊狂奔，一邊失血

04-01

OpenAI將建造大型機器人研發設施

04-01

蘋果CarPlay正式接入ChatGPT，iOS 26.4系統開啟車載語音AI新體驗

04-01

反對技術革新？蘋果限制AI編程應用更新

04-01

Salesforce全面重塑Slack：AI助手Slackbot能力大增

04-01

新研究發現：全球大型數據中心產生“熱島效應”

04-01

點擊查看更多 +

全站最新

ETF風向標 | 創新藥板塊全線爆發，恒生創新藥ETF、港股通創新藥ETF漲超8%，黃金ETF單日“吸金”16.9億

光明乳業解鎖上海專屬味道，"梧桐樹下享濃上海"新品首發

美股異動丨名創優品盤前續漲超2% 旗下TOP TOY重新遞表港交所

美股異動丨VCX盤前大漲超12%，美股三大“超級獨角獸”IPO箭在弦上

黑芝麻智能營收三連增，智駕疊加具身智能放量，端側AI打開成長空間

港股收評：4月開門紅！恒指大漲2%，航空股起飛，石油股趴窩

熱門內容

本欄最新

十年磨一劍啟新程！吉利博越REV全球上市硬核實力開啟A+級SUV新篇章

吉利博越REV杭州上市增程技術加持續航超1500km 售價10.79萬起

范式智能2025年營收達71.35億：AI業務增長顯著，實現扭虧為盈

優必選2025年業績亮眼：全尺寸人形機器人收入激增產能訂單雙領跑

吉利博越REV煥新登場續航強勁配置拉滿十年熱銷再啟新程

AI從“對話”邁向“做事”新階段華為攜手伙伴共拓行業數智新篇

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

DeepSeek V4基準測試引熱議，編程能力或超頂尖閉源模型，明日發布？

DeepSeek V4基準測試引熱議，編程能力或超頂尖閉源模型，明日發布？