今日,智譜AI宣布,其與華為聯合開源的新一代圖像生成模型GLM-Image,在開源上線不到24小時內,便一舉登上全球知名AI開源社區Hugging Face(抱抱臉)的榜單全球第一。
智譜AI表示,這是國際上首次由完全依托國產芯片訓練的模型斬獲榜首,標志著國產AI模型在端到端自主研發能力上取得了重大突破,成功躋身全球競爭前列。
據悉,GLM-Image是基于華為昇騰Atlas 800T A2訓練設備及昇思MindSpore AI框架,完成了從數據處理到模型訓練的全流程開發。這使得GLM-Image成為首個在國產芯片上完成全程訓練的SOTA(當前最佳)多模態大模型,驗證了國產AI算力生態的成熟度。
在模型架構設計上,GLM-Image摒棄了開源界常用的LDM方案,創新性地采用了自回歸與擴散解碼器相結合的混合架構。這種設計有效兼顧了對全局指令的深度理解和對局部細節的精細刻畫。
性能表現方面,GLM-Image在CVTG-2K(復雜視覺文本生成)和LongText-Bench(長文本渲染)兩個權威榜單上均斬獲開源世界第一。模型不僅能精準讀懂指令,還能準確書寫文字,尤其在漢字生成任務上表現優異,可廣泛應用于海報設計、PPT制作、科普圖解等知識密集型場景。
在商業化落地層面,GLM-Image展現了極高的性價比。在API調用模式下,單張圖片的生成成本僅為0.1元。這一價格大幅降低了企業和開發者使用先進圖像生成技術的門檻,有助于加速AI視覺技術在各行各業的應用普及。











