滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

多芯片算子自動生成新突破：KernelGen助力AI開發跨越“手搓”門檻

時間：2026-02-06 23:43:14 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

在AI芯片生態日益多元化的背景下，如何降低跨平臺軟件遷移成本成為行業焦點。近期，眾智FlagOS社區推出的KernelGen工具與統一編譯器FlagTree組合方案，為算子跨芯片自動生成提供了系統性解決方案。該方案通過自動化工具鏈覆蓋算子開發全生命周期，在華為昇騰、摩爾線程、海光、天數智芯等國產AI芯片及英偉達GPU上完成系統性驗證，標志著算子開發模式從手工編碼向工程化生產轉變。

技術實現層面，KernelGen構建了四層架構體系：用戶可通過自然語言、數學公式或現有代碼描述需求；大模型驅動的智能體自動生成Triton內核代碼；驗證層構建多維度測試用例，在目標芯片上與PyTorch參考實現進行數值比對；最后通過性能評估與自動化調優確保執行效率。這種全流程自動化方案將算子開發效率提升數個量級，特別是在多芯片適配場景下，避免了重復開發帶來的資源浪費。

統一編譯器FlagTree是支撐跨芯片適配的核心基礎設施。該項目自2025年啟動以來，已支持12家廠商近20款芯片，涵蓋DSA、GPGPU、RISC-V AI及ARM等多種架構。通過建立統一的硬件中間表示層，FlagTree將芯片差異封裝在編譯階段，使算子生成邏輯無需關注底層硬件細節。最新發布的v0.4版本引入Triton語言擴展機制，提供Lite、Struct、Raw三層編程接口，既保證基礎代碼的跨平臺兼容性，又為性能優化保留靈活空間。

實際評測數據顯示，在110個代表性Torch算子的多輪生成測試中，KernelGen取得82%的編譯成功率與62%的執行正確率。不同芯片表現呈現差異化特征：華為昇騰在代碼生成階段表現突出，英偉達平臺則保持最高的數值準確性。當使用FlagTree編譯器時，各平臺執行正確率顯著提升，特別是在英偉達GPU上達到70%的通過率，較原生編譯器提升近20個百分點。這種穩定性優勢為后續性能優化奠定了基礎。

大模型能力差異在算子生成任務中表現明顯。以華為昇騰平臺為測試環境，GPT-5展現出最強綜合能力，在110個算子中有65個實現完全正確的數值輸出。GLM-4.7在復雜算子處理上存在波動，而Qwen3-Max等模型受限于語義理解深度，生成成功率相對較低。這表明算子自動生成不僅需要代碼生成能力，更考驗模型對數學運算邏輯、邊界條件處理等底層機制的理解。

性能優化方面，通過引入模型自反思機制與專家知識庫，KernelGen實現顯著突破。在英偉達平臺測試中，優化后算子執行正確率提升至75.5%，其中68.5%的算子獲得超過1倍的加速效果，整體性能中位數達1.04倍。這種持續進化能力證明，算子自動生成已突破"可用"階段，正在向"高效"方向邁進。特別在融合外部專家知識后，系統能夠針對特定硬件特性進行深度調優，這種人機協同模式為AI基礎設施發展開辟新路徑。

當前行業面臨的硬件碎片化挑戰，在KernelGen方案中找到破局之道。該工具鏈通過抽象化硬件差異、自動化生成驗證流程，將算子開發周期從數周壓縮至小時級。在金融、醫療等對系統穩定性要求極高的領域，這種可驗證的數值正確性保障具有特殊價值。隨著FlagTree編譯器支持的芯片數量持續增長，跨平臺算子庫的規模效應正在顯現，有望解決長期困擾AI落地的"芯片孤島"問題。

更多>同類資訊

阿里除夕夜甩出王炸！千問Qwen3.5重磅發布登頂全球最強開源模型

02-17

馬斯克重申：特斯拉Cybercab今年4月投產

02-17

特斯拉開始在歐洲車輛推廣Grok人工智能助手

02-17

阿里發布新一代基模千問3.5，登頂全球最強開源大模型

02-17

宇樹王興興發文：為科技的夢想干杯

02-17

馬年春晚兩小時：京東機器人搜索量飆升，多款“春晚同款”遭搶購

02-17

OpenClaw創始人投身OpenAI：智能體AI新賽道，行業變革序幕拉開

OpenClaw 周圍的社區有一種神奇的魔力，OpenAI 已做出強有力的承諾，支持我投入時間維護它，并已開始贊助這個項目。而OpenClaw的技術，恰恰切中了這個方向最核心的問題：多個AI智能體之間，如…

02-17

春晚機器人驚艷亮相：中國科技實力引外國網友“愛恨交織”

有媒體采訪這段武術對打的幕后故事時從塔溝武術學校王教練處得知，這些機器人此前經過大量訓練，而且是把“武林高手”的代表招式，都由人類在影棚里先做一遍，按步驟拆解，再通過動作捕捉技術，轉化為機器人能識別的程序，…

02-17

小米Tag追蹤器或推國行版海外售價近148元兼容多平臺定位

IT之家 2 月 13 日消息，博主 @智慧皮卡丘發文，透露小米昨天在歐洲市場推出的 Xiaomi Tag追蹤器也將推出國行版本，還有“陶瓷手環在路上”。作為比較，海外 Xiaomi Tag 追蹤器單個…

02-17

2026手機廠商大變革：“華米OV耀”跨界出擊相機市場格局生變

但MWC 2026開幕在即，手機廠商們的槍口不再只是對準彼此，而是齊刷刷地調轉方向，瞄準了那個曾經被認為“神圣不可侵犯”的領地——專業相機與手持影像設備市場。經過數月的供應鏈摸排與信息匯總，不客觀實驗室拼…

02-17

Murena Volla隱私平板登場：搭載安卓14系統，硬件配置強勁且注重隱私保護

Murena Volla 搭載了基于 Android 14 的 /e/OS 系統，而不是 Volla OS 或 Ubuntu Touch。Murena Volla 平板電腦日前以 798 美元（IT之家注…

02-17

春節AI購物熱潮涌動，千問助力超1.3億人嘗鮮，日活飆升成新寵

如果說去年春節是深度思考出圈的DeepSeek時刻，今年春節就是AI辦事出圈的千問時刻，“千問幫我”已成為AI時代的用戶新習慣。除夕當天，阿里巴巴還開源全新一代大模型千問Qwen3.5-Plus，性能媲美…

02-17

Murena Volla隱私平板來襲：搭載安卓系統，開源應用助力隱私保護

02-17

馬斯克三度確認：特斯拉Cybercab 4月投產自動駕駛網約車新篇將啟

02-17

馬年春晚機器人表演引熱潮：京東機器人搜索訂單量雙雙激增

02-17

點擊查看更多 +

全站最新

松延動力與魔法原子人形機器人閃耀2026年春晚舞臺展現科技魅力

春節AI購物熱潮涌動，千問助力超1.3億人嘗鮮，日活飆升成新寵

全新馬自達CX-30來襲！動力足油耗低，都市通勤的省心“搭子”

高端踏板終極對決！吳老臭實測揭秘：XADV750與TMAX560誰更值得入手？

凱美瑞雙擎通勤一年：油費省出手機錢，但這些槽點實在難忍！

中年人偏愛奔馳GLC：底盤扎實動力穩，選對配置省8萬冤枉錢

熱門內容

本欄最新

春節AI購物熱潮涌動，千問助力超1.3億人嘗鮮，日活飆升成新寵

千問3.5：以第一性原理破局，重塑大模型性能、開源與性價比新格局

2026央視春晚科技味濃：超20家企業合作，4家機器人企業攜新品驚艷亮相

小米YU7 GT純電性能猛獸來襲！超千匹馬力配超寬胎，4月上市劍指Model Y高性能版

雷軍微博換新頭像引熱議！網友：健身后氣場足，配SU7 Ultra似賽車手

奧迪E7X量產版亮相：大五座設計配751km長續航，上半年上市引期待

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

多芯片算子自動生成新突破：KernelGen助力AI開發跨越“手搓”門檻