近日,阿里巴巴在人工智能領(lǐng)域再次引發(fā)關(guān)注,其旗下千問大模型團(tuán)隊(duì)宣布開源一系列新模型,涵蓋中等規(guī)模和小尺寸兩個(gè)類別,展現(xiàn)了在模型架構(gòu)創(chuàng)新與訓(xùn)練技術(shù)上的突破性進(jìn)展。
此次開源的中等規(guī)模模型包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B和Qwen3.5-27B三款。通過架構(gòu)優(yōu)化與訓(xùn)練方法革新,這些模型在同等參數(shù)規(guī)模下實(shí)現(xiàn)了邏輯推理、知識儲備和任務(wù)處理能力的顯著提升,刷新了中等尺寸模型的性能紀(jì)錄。特斯拉創(chuàng)始人馬斯克在社交平臺對Qwen模型作出評價(jià),稱其"智能密度令人印象深刻",這一概念特指模型在固定參數(shù)或算力消耗下展現(xiàn)的綜合能力水平。
在輕量化模型領(lǐng)域,阿里同步推出Qwen3.5-0.8B/2B/4B/9B四款小尺寸系列。該系列采用原生多模態(tài)訓(xùn)練框架與最新模型架構(gòu),在保持Qwen3.5家族核心優(yōu)勢的同時(shí),針對資源受限場景進(jìn)行了深度優(yōu)化。官方測試數(shù)據(jù)顯示,這些模型在極端低算力環(huán)境下仍能保持高效運(yùn)行,可滿足從嵌入式設(shè)備到邊緣計(jì)算等多樣化應(yīng)用需求。
技術(shù)專家指出,此次開源的模型矩陣體現(xiàn)了"全尺寸覆蓋"的戰(zhàn)略布局。中等規(guī)模模型通過創(chuàng)新架構(gòu)突破性能瓶頸,小尺寸系列則通過多模態(tài)訓(xùn)練實(shí)現(xiàn)能力躍遷,兩者共同構(gòu)建起從移動(dòng)端到云端的全場景解決方案。這種技術(shù)路線既保持了開源生態(tài)的開放性,又為不同量級的應(yīng)用開發(fā)提供了靈活選擇。










