近日,人工智能領域傳來一則引人關注的消息:DeepSeek在籌備重大模型更新時,采取了與行業常規做法不同的策略。通常情況下,AI開發者會將主要模型的預發布版本分享給英偉達、AMD等芯片制造商,目的是確保軟件能在廣泛使用的硬件上高效運行。然而,DeepSeek此次卻未遵循這一慣例,未向美國芯片制造商展示其即將推出的旗艦模型。
據了解,DeepSeek此次將V4模型的早期訪問權限提供給了國內供應商,其中就包括華為技術有限公司。這一舉動打破了行業長期以來的標準做法,此前DeepSeek曾與英偉達的技術人員有過密切合作,此次卻未給予英偉達和AMD訪問即將推出模型的權限,而是給予包括華為在內的中國廠商幾周時間來適配其芯片。
對于這一情況,英偉達和AMD均拒絕發表評論,DeepSeek和華為也未對相關評論請求作出回應。盡管如此,這一事件還是引發了行業內外的廣泛關注和討論。
與此同時,消息源@legit_api于2月26日在X平臺發布推文稱,DeepSeek正在測試V4 Lite模型,該模型代號為“Sealion - lite”,擁有100萬tokens的上下文窗口,并且原生支持多模態推理。本月早些時候,DeepSeek更新后開始灰度測試最高1M(百萬)Token的上下文長度,其最新知識庫已更新到2025年5月,即便在非聯網狀態下,也能準確輸出2025年4月的新聞。











