近日,一款名為GLM-Image的新一代圖像生成模型引發全球AI領域關注。該模型由智譜與華為聯合開發,在開源后不到24小時內便登頂國際知名AI開源社區Hugging Face的榜單首位,成為首個完全基于國產芯片訓練并取得國際排名第一的國產模型。
據開發團隊介紹,GLM-Image的研發全程依托國產技術生態:訓練設備采用昇騰Atlas 800T A2服務器,AI框架使用昇思MindSpore,實現了從數據處理到模型訓練的全鏈條國產化。這一突破標志著中國在AI模型端到端自主研發領域邁出關鍵一步,為全球AI技術競爭提供了新的中國方案。
在技術架構層面,GLM-Image突破了傳統開源模型常用的LDM方案,創新性地融合自回歸與擴散解碼器技術。這種混合架構使模型既能準確理解全局指令,又能精細刻畫局部細節,尤其在復雜視覺文本生成和長文本渲染任務中表現出色。測試數據顯示,該模型在CVTG-2K和LongText-Bench兩項國際權威基準測試中均獲得開源模型第一名。
漢字生成能力是GLM-Image的顯著優勢。相比其他模型,該系統能更精準地理解中文指令,在海報設計、PPT制作、科普圖生成等知識密集型場景中展現強大應用潛力。開發團隊特別強調,模型經過針對性優化,可穩定生成結構復雜、筆畫精細的漢字,有效解決了中文圖像生成領域的技術痛點。
商業化應用方面,GLM-Image通過API調用模式將單張圖片生成成本壓縮至0.1元,較市場同類產品降低約70%。這一成本優勢使其特別適合中小企業和開發者使用,有望推動圖像生成技術在教育、傳媒、電商等行業的普及應用。目前,多家企業已啟動與開發團隊的對接,探索定制化解決方案。
行業專家指出,GLM-Image的成功不僅體現在技術指標上,更在于其構建了完整的國產AI技術棧。從芯片到框架再到模型應用的全鏈條突破,為中國AI產業擺脫對國外技術的依賴提供了重要范本,這種自主可控的發展模式或將重塑全球AI技術格局。











