今天傍晚,DeepSeek再度出現服務異常,社交平臺上不少用戶反饋,對話過程中頻繁遭遇“請檢查網絡后重試”或“服務器繁忙”等提示。目前,服務已恢復正常。
這是三天之內DeepSeek第二次發生服務故障。上周日,平臺曾經歷上線以來最長的一次中斷。
3月29日晚9點35分起,大量用戶發現DeepSeek無法發起新對話,已有對話頻繁中斷,屏幕上反復彈出“服務器繁忙”的提示。當晚11點23分,系統曾短暫恢復,但不到1小時再度崩潰。技術團隊隨即啟動二次修復,直至次日上午10點33分才宣布故障排除。
整個過程持續時間近12小時,波及網頁端與App端,修復過程也一波三折。相關話題迅速登上微博熱搜引發熱議,在海外開發者社區里同樣炸開了鍋。公開記錄顯示,DeepSeek網頁端此前從未出現超過2小時的服務中斷。
這兩次宕機,恰逢DeepSeek模型更新周期的敏感節點。近期,關于DeepSeek V4的基準測試數據已在業內流傳,坊間傳言的發布時間也已多次推遲。
有技術觀察人士猜測,DeepSeek近日服務不穩,可能與它正處于“臨發布狀態”有關。頻繁的服務器壓力測試、底層架構調整與新模型部署等,都有可能引發服務波動。
還有細心的網友發現了一些“蛛絲馬跡”。比如有海外開發者在Zero-shot(零樣本)編碼測試中注意到,DeepSeek當前的輸出結構比前幾天更加清晰,邏輯嚴謹程度大大提升;也有網友發現,DeepSeek在Web應用程序中進行了升級,輸出效果改善明顯;還有網友觀察到,App端的上傳按鈕界面進行了更新,而類似這種細微變化,通常預示著后端架構正在或即將經歷大幅調整。
雖然V4尚未正式發布,但DeepSeek團隊這段時間并沒有閑著。過去幾個月,DeepSeek接連與北京大學、清華大學合作發布了多篇重磅論文,提前“劇透”了V4的關鍵技術方向。
1月,由梁文鋒署名的論文提出Engram“條件記憶”模塊,解決了Transformer的記憶難題。這種將固定知識從Transformer中剝離出來的全新機制,讓模型不再需要用昂貴的計算去“死記硬背”,而是通過近乎O(1)的查表操作快速獲取知識。
這兩項技術突破,一個指向模型架構層面的“記憶與計算分離”,一個指向推理系統層面的“I/O瓶頸突破”,恰好構成了V4從算法到底座的兩大技術支柱。
市場和網友們對DeepSeek新版本的期待,并非沒有緣由。作為一度攪動大模型價格戰的“價格屠夫”,DeepSeek此前以極具競爭力的定價策略,大幅降低了開發者調用大模型的門檻。
在算力成本仍是行業核心痛點的當下,大家渴望DeepSeek能夠再次帶來成本更低的Token,讓更為高效且廉價的大模型能力,惠及更多開發者和應用場景。
橙柿互動·都市快報記者 童蔚
編輯 成嘉怡
審核 張倩 陳欣文
校對 陳潔珍











