國產大模型領域迎來重要進展,頭部企業深度求索近日針對旗下產品推出關鍵更新,引發行業關注。據多位用戶反饋,其核心產品DeepSeek已在網頁端和移動應用端啟動灰度測試,上下文窗口容量從原有的128K大幅擴展至1M級別,相當于百萬Token的處理能力。經實際測試驗證,系統顯示的上下文長度參數已同步更新。
此次升級帶來的技術突破具有顯著意義。測試數據顯示,新版本模型在離線狀態下可精準生成2025年4月的新聞內容,知識庫更新至2025年5月,標志著其時效性能力實現質的飛躍。更值得關注的是,1M的上下文處理能力使模型能夠一次性完整解析《三體》全集規模的超長文本,直接達到GPT-5及Gemini 3 Pro等國際頂尖產品的技術水準。
用戶體驗層面出現明顯優化。參與測試的開發者指出,新模型的語言輸出風格更趨人性化,既保持專業推理能力又增添情感溫度,前端交互響應質量獲得"媲美Claude 3.5 Sonnet"的高度評價。這種改進被解讀為企業在保持技術領先的同時,著力提升消費級應用體驗的戰略舉措。
技術路線選擇方面,此次更新暫未涉及多模態功能拓展。模型仍專注于文本與語音交互領域,未加入視覺理解等跨模態能力。這種聚焦核心功能的升級策略,可能為后續技術迭代預留了空間。
企業人才戰略同步調整。近期公開招聘信息顯示,深度求索正在大規模擴充技術團隊,開放崗位涵蓋深度學習研究、預訓練數據開發、大模型全棧工程等關鍵領域。招聘方向既包括預訓練、對齊技術等前沿探索,也涉及算法工程化落地,同時開放校招、社招及實習通道,顯示企業正處于快速擴張階段。
版本命名尚未正式公布。行業觀察人士推測,此次灰度測試版本可能對應此前流傳的"DeepSeek V4"或強化型V3.2系列。企業官方對此保持沉默,僅表示將根據測試反饋決定最終版本策略。











