岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

超越英偉達,天數智芯公布路線圖

   時間:2026-01-28 11:43:45 來源:半導體行業觀察編輯:快訊 IP:北京 發表評論無障礙通道
 

過去很長一段時間里,被人工智能帶火的GPGPU 行業的討論只是停留在一個相對安全、卻也相對空洞的層面:參數、峰值算力和制程等。但在大模型開始進入企業業務、科研生產和物理世界,很多人突然發現——算力不再是“有沒有”,而是“好不好用、值不值這個價”。

作為算力的主力,GPGPU 也進入了一個更現實、也更殘酷的階段:不再只是“能跑模型”,而是必須經得起真實場景、真實客戶和長期運行的檢驗。面對這種轉變,國產GPU廠商如何應對,是衡量企業能否轉注下一波AI浪潮的的關鍵。

近日,本土首家GPGPU廠商天數智芯發布了公司面向未來的芯片架構路線圖,最新邊端產品,以及公司在應用和生態方面的布局,為助力中國人工智能邁向新階段做好充分準備。

公布四代架構,已超越Hopper

如果用一個詞來形容這些年人工智能對算力的要求,“性能”無疑是一個極具競爭力的候選。尤其是在大模型浪潮席卷全球之后,模型訓練參數越來越巨大,如何打造越來越高性能的基礎設施就成為了所有從業者聚焦的重點。

換而言之,隨著大模型參數規模從百億邁向萬億級,數據中心的需求已不再只是增加 GPU 數量,而是全面升級為系統工程問題:單機柜算力密度快速提升,帶來更高的供電與散熱壓力;模型并行與分布式訓練放大了對高速互連和低延遲網絡的依賴;長期高負載運行使 PUE、TCO 和穩定性成為核心指標。也就是說,如何推動數據中心正在從“堆硬件”的算力工廠,轉向圍繞效率、可靠性和可持續性的綜合算力基礎設施,已經成為了當下以未來的工作重點。

天數智芯AI與加速計算技術負責人單天逸也直言道,過去十年是算力野蠻增長的十年,規模的快速擴張確實帶來了階段性的產業繁榮。但繁榮背后,是難以忽視的效率困局。

“推理場景的平均利用率不足 20%,訓練場景的平均利用率也僅在40%出頭,我們的理論算力一路飆升,可到了實際應用場景里,效率卻大打折扣。這種粗放式發展,直接導致了能效比失衡、算力資源嚴重浪費的問題。”單天逸舉例說。

有見及此,單天逸指出,擁有高效率、可預期以及可持續三個特征的高質量算力勢在必行。

據介紹,所謂高效率,是指能為客戶創造最優的 TCO,實實在在幫客戶節省使用成本;至于可預期,是指可以通過精準的仿真模擬,讓客戶在拿到芯片、部署算力之前,就能清晰預判最終的性能表現,做到所見即所得;來到可持續方面,是指不但能支持現在主流的 CNN、RNN和 Transformer,還能支持和適配目前還未誕生的全新算法。“我們堅持聚焦通用算力,確保產品在長期周期內仍能穩定發揮算力價值”,單天逸總結說。

基于這個思考和定位,單天逸公布了天數智芯的四代架構路線圖:2025年,天數天樞架構在DeepSeek R3場景中實現性能超越英偉達Hopper 20%;2026年,天數天璇架構對標Blackwell;2026年,天數天璣架構超越Blackwell;2027年,天數天權架構超越Rubin;2027年之后將轉向突破性計算芯片架構設計。

為了實現高質量算力的目標,天數智芯微天數天樞架構引入了多項核心技術創新。其中,TPC BroadCast(計算組廣播機制) 設計通過上游數據廣播減少重復訪存,等效提升帶寬并降低功耗;Instruction Co-Exec(多指令并行處理系統)設計實現多類型指令并行處理,增強復雜任務處理能力;Dynamic Warp Scheduling(動態線程組調度系統)機制則通過動態調度避免資源爭搶,提升計算資源利用率。

面向未來的計算需求,天數智芯也為天數天樞架構提供了從高精度科學計算到AI精度計算支持,能讓AI 芯片在執行注意力機制相關計算時,算力的實際有效利用效率達到 90% 及以上;來到天數天璇架構,還將新增 ixFP4 精度支持。在天數天璣架構和天數天權架構,天數智芯也將先后實現全場景AI與加速計算覆蓋并融入更多精度支持與創新設計。

基于這些架構,天數智芯為打造面向未來的算力打下了夯實的基礎。

端側產品“四劍”齊發,

實現全場景布局

在上述的架構加持下,天數智芯計劃在未來3年推出包括“天垓”和“智鎧”系列在內的多款芯片,持續提升每瓦性能、每平方毫米性能極限,迭代核心計算單元、提高芯片效率,實現每代產品每塊錢token處理能力翻倍。而在芯片的持續迭代過程中,人工智能本身也在變化。

隨著 AI 形態從單次推理演進為以 Agent 為核心的持續運行體系,并進一步進入物理世界,算力需求的約束正在系統性改變——由集中式訓練主導的峰值算力需求,轉向以高頻、多步、長時推理為特征的持續負載。與此同時,Physical AI 的落地推動大量推理任務向邊端和端側下沉,使邊端芯片的需求重心從“算得動”轉向“算得久、算得穩、算得省”,對能效比、實時響應和可靠性提出更高要求。

天數智芯副總裁郭為也認可道:“未來的應用場景不僅需要會說話的AI,更需要會做事的AI,理解物理世界的規律,具備具身意識。換而言之,生成AI必然轉向物理AI。”正是因為有著這種共同的見解,天數智芯帶來了“彤央”系列邊端產品。按照郭為所說,這是AI和物理世界融合的媒介,這也是天數智芯實現“賦能邊端智慧,連接物理空間”愿景的重要依仗。

據介紹,此次發布的四款產品形態各異、各有側重。其中,彤央 TY1000 算力模組采用 699pin 接口,以口袋大小集成行業級算力與開放生態,實現便攜化部署;彤央 TY1100 算力模組集成ARM v9 12核CPU 與自研GPU模組,以充沛算力提供多元選擇;彤央TY1100_NX 算力終端憑借更大顯存成為高性價比之選,堪稱邊端算力“小鋼炮”;彤央TY1200 算力終端則以 300TOPs 的極致性能與小巧身材,為 AIPC、具身智能等前沿場景提供核心支撐。

據透露,彤央全系列產品的標稱算力均為實測稠密算力,覆蓋 100T 到 300T 范圍。在計算機視覺、自然語言處理、DeepSeek 32B 大語言模型等多個場景的實測中,彤央 TY1000的性能全面優于英偉達AGX Orin。“彤央系列產品兼具高算力、成熟生態、靈活可拓展的核心優勢,是連接AI與物理世界的最佳載體。我們的目標是成為國內邊端大算力領域的領軍者”,郭為說。

隨著彤央系列的發布,天數智芯已經有了覆蓋云端訓練(天垓系列)、推理(智鎧系列)、邊端場景(彤央系列)的全棧式算力布局,讓公司可以提前卡位物理 AI 時代。而為了幫助開發者更好地利用公司的算力,天數智芯在軟件棧方面也火力全開。在招股說明書中,天數智芯就強調,公司在提供多種通用GPU芯片及加速卡的同時,搭配自主開發的全棧軟件開發工具包(如驅動編譯器、性能優化的函數庫、AI訓練框架及推理引擎),從而實現訓練及推理場景下強大的AI應用。

“過去七年,天數始終以設計好用、可落地的產品為核心,在國際供應鏈局勢劇烈變化的背景下,堅持從架構核心IP到編譯器、驅動全自研,是國內首家補全GPU全棧設計能力的企業。”天數智芯副總裁鄒翾重申。“借助本次發布,我們實現了云端、邊緣側、端側全場景覆蓋,且全鏈路生態統一,同時兼容主流生態。目前國內頭部GPU廠商中,天數智芯是唯一實現云邊端生態統一且全面兼容主流體系的企業,這個完整方案是我們的重要優勢。”郭為補充說。

從一份基于ByteMLPerf對天數智芯GPGPU芯片開展系統評測的報告中可以看到,天數智芯這種全棧的設計優勢擁有極大的優勢。

據介紹,通過采用 SIMT 架構,天數智芯在算子上實現了極高的硬件利用率;借助通算融合與流水線并行等“揚長避短”策略,天數智芯方案的吞吐量與首詞延遲在 DeepSeek R1 等大模型場景下的表現優于 A800,這展現出深度的軟硬件協同優化能力與強勁的國產算力實戰價值。(具體參考文章《ByteMLPerf 實測:天數智芯 GPGPU 全鏈路技術解析,創新釋放高效算力》)

集群穩定運行千天,

爭當AI落地堅實底座

在與半導體行業觀察等溝通時候,天數智芯多次強調,在當前的人工智能行業,通用計算是一個明確的發展方向。而要成為這條賽道的重要賦能者,就需要回歸到通用計算的本質,支持所有種類的計算。天數智芯一直堅信:不要讓算力的僵化,限制算法的進化。硬件絕不應該成為束縛算法探索的枷鎖,而要做孵化新算法的堅實底座。

正是在這種堅持的推動下,截止2025年年底,天數智芯在互聯網大模型研究、金融、醫療、交通等超過20個行業落地諸多應用,與超1000家用戶共同探索算法演進,通過軟硬件協同優化,使產品能力達到商業級別,陪伴300多家客戶進入量產階段。這些數據背后,是公司產品性能的最好證明。例如在科學探索領域,天數智芯已經適配320種通用計算模型,單集群可并行數千卡科研任務,穩定運行1000多天,已落地國內多家頂級學府。

除此以外,在互聯網AI領域,天數智芯實現了單機性能翻倍、Token成本減半、人力節省1/3;在大模型適配上,達成95%算子復用,可應對NGS(下一代測序數據處理)處理等場景中算法繁雜、負載波動大的問題;金融領域,研報生成效率提升70%,量化分析響應速度提升30%;醫療領域,結構化病歷生成時間縮至 30 秒/份,腸胃鏡病灶定位精度提升30%;為各行業發展提供堅實AI算力支撐。在此期間,公司的營收在2022到2024 年間實現了 68.8%復合增長率,截至2025年6月30日,公司累計也交付逾 5.2 萬片通用 GPU 產品。

來到最新發布的彤央系列產品上,天數智芯也推動其落地大量應用場景:具身智能領域,為格藍若機器人提供高算力、低延遲的“大腦”支撐;在工業智能領域,落地園區與產線,推動產線自動化升級;在商業智能領域,瑞幸咖啡數千家門店部署彤央方案,高效處理視頻流、挖掘消費數據價值;在交通智能領域,與“車路云一體化”20大頭部試點城市合作,驗證車路協同方案。

在鄒翾看來,AI驅動的算法與應用浪潮已全面開啟,每個設計者既是貢獻者也是受益者。作為一個領先賦能者,天數智芯將一如既往地堅持高效率、可預期、可持續的架構理念,持續打造高性能、高性價比、更好用的產品,提供穩定可靠的算力底座,推動AI規模化落地,寄望未來每位開發者都能通過簡單編程獲取觸手可及的算力,將創意轉化為推動人類進步的力量,實現算力普惠、創新無界。

“天數智芯堅定認為,生態決定開發成本、性能、應用覆蓋率與用戶體驗,公司后續將持續加大生態投入,從應用框架到模型庫、從開發工具到行業方案、從軟件棧到芯片優化,與合作伙伴共同打磨面向未來的易用AI系統,為用戶創造極致性能、最優性價比與真正易用性三大核心價值。”鄒翾補充說。

值得一提的是,依托 kv cache 量化 + 無損反量化的核心技術組合,天數智芯能讓模型推理中的實際內存使用量直接降低 50% 以上,從底層大幅減少對高成本存儲資源的依賴;同時憑借自研 IX-SIMU 全棧軟件系統,可實時適配存儲市場的動態價格變化,為客戶完成專業的硬件適配測算與組合選型,精準鎖定最具性價比的硬件搭配方案,讓客戶在價格波動的市場環境中,既實現推理性能的保障,又能最大化控制部署成本,達成 AI 推理落地的性能與成本最優解。

在當前內存價格高企給企業帶來巨大挑戰的當下,這再次體現了天數智芯方案的優越性。

寫在最后

單天逸告訴半導體行業觀察:“與一家純芯片公司相比,天數智芯更傾向于將自己定位為解決方案提供商,幫客戶解決實際問題。”作為一家通用GPU供應商,如上所述,這也是天數智芯一直在踐行的戰略。

但是,我們也必須承認,大模型大局依然未定,未來依然充滿很多可能,這就對算力有了不同的需求。基于這個事實,天數智芯在堅持以通用計算為核心,確保產品適配更廣泛的場景與未來算法迭代之余。還兼顧定制化優化,通過DSA等技術實現定制化需求落地。這和英偉達等業界領先廠商的做法不謀而合。

在談到未來展望時,單天逸表示,客戶對核心技術國產化的認可度在提升,這為公司創造了良好的合作基礎。公司在未來也先也將持續積累,堅持自主創新,尋找原創性突破的機會,力爭成為具備行業定義能力的企業。

“我們不追求成為‘第二個英偉達’,就像科比不想成為第二個喬丹,我們要走出自己的道路。”單天逸說。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 亚洲色图日韩 | 在线免费观看中文字幕 | 欧美一级免费大片 | 国内视频精品 | 久热在线| 亚洲乱码精品久久久久.. | 黄色网页在线 | av黄网| 国产 日韩 欧美 精品 | 中文字幕在线一区 | 国产精品自拍偷拍 | 日韩欧美久久久 | 欧美日本一区二区 | 国产91亚洲 | 美女网站在线观看 | 成人免费视频一区 | 日韩在线视频网 | 国产 夫妻 视频 绿帽 3p | 国产性色av | 99欧美 | 国内精品免费视频 | 亚洲视频在线一区二区 | 久久激情视频 | 巨骚综合 | 国产精品精品久久久 | 人人搞人人| av网站大全在线 | 97视频精品 | 免费在线不卡视频 | 玖玖热在线视频 | 一级片在线 | 蜜臀久久99精品久久一区二区 | 久久久日本| 亚洲乱码精品久久久久.. | 国产精品麻豆传媒 | 久久激情网站 | 激情丁香六月 | 成人精品国产 | 香蕉视频成人在线观看 | 欧美a在线观看 | 黄色大片免费在线观看 |