阿里巴巴近日正式推出全新一代大語言模型千問Qwen3.5-Plus,標(biāo)志著國產(chǎn)大模型在架構(gòu)創(chuàng)新與工程優(yōu)化領(lǐng)域取得突破性進(jìn)展。該模型總參數(shù)規(guī)模達(dá)3970億,通過動態(tài)稀疏激活技術(shù)將實際計算量壓縮至170億參數(shù)級別,在保持性能優(yōu)勢的同時顯著降低計算資源消耗。測試數(shù)據(jù)顯示,其綜合性能已超越萬億參數(shù)規(guī)模的Qwen3-Max,推理效率提升尤為顯著,部署顯存占用減少60%,最大推理吞吐量達(dá)到前代的19倍。
在商業(yè)化應(yīng)用方面,Qwen3.5-Plus展現(xiàn)出強大的成本優(yōu)勢。其API服務(wù)定價降至每百萬Token 0.8元,較同類產(chǎn)品降低約40%,為中小企業(yè)和開發(fā)者提供更具性價比的選擇。目前該模型已全面接入千問APP及PC端應(yīng)用,用戶可通過阿里云百煉平臺直接調(diào)用API服務(wù),魔搭社區(qū)與HuggingFace同步開放模型下載通道。
同步發(fā)布的還有Qwen3.5-397B-A17B開源旗艦?zāi)P停cQwen3.5-Plus形成差異化布局。兩款模型均支持文本生成與多模態(tài)任務(wù)處理,在代碼生成、邏輯推理、跨語言理解等核心場景表現(xiàn)突出。技術(shù)團(tuán)隊透露,新一代模型通過改進(jìn)注意力機(jī)制與知識蒸餾策略,在保持開源特性的同時實現(xiàn)了性能躍升,特別在長文本處理與復(fù)雜指令遵循方面表現(xiàn)優(yōu)異。
行業(yè)觀察人士指出,此次發(fā)布標(biāo)志著大模型競爭進(jìn)入工程化階段。阿里通過架構(gòu)創(chuàng)新實現(xiàn)"大而精"的技術(shù)突破,既保持了模型的強大能力,又解決了高參數(shù)模型部署困難的問題。這種技術(shù)路線或?qū)⑼苿有袠I(yè)從單純追求參數(shù)規(guī)模轉(zhuǎn)向效率與性能的平衡發(fā)展,為AI技術(shù)的規(guī)模化應(yīng)用開辟新路徑。










