阿里巴巴近日宣布正式開源其最新研發(fā)的Qwen3.5小尺寸模型系列,包含0.8B、2B、4B和9B四個(gè)參數(shù)規(guī)模的版本。這一系列模型基于Qwen3.5家族的核心技術(shù)架構(gòu),通過原生多模態(tài)訓(xùn)練方式實(shí)現(xiàn)性能突破,能夠靈活適配從資源極度受限的邊緣設(shè)備到高性能輕量化應(yīng)用場(chǎng)景的多樣化需求。
該系列模型采用模塊化設(shè)計(jì)理念,在保持低計(jì)算資源消耗的同時(shí),通過優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)提升了推理效率。其中最小規(guī)模的0.8B模型僅需少量顯存即可運(yùn)行,而9B版本則在保持輕量級(jí)特性的基礎(chǔ)上,實(shí)現(xiàn)了接近更大規(guī)模模型的性能表現(xiàn)。技術(shù)團(tuán)隊(duì)特別強(qiáng)調(diào),所有版本均支持多模態(tài)輸入輸出,可同時(shí)處理文本、圖像等多種數(shù)據(jù)類型。
國(guó)際科技界對(duì)該系列模型給予高度關(guān)注。特斯拉創(chuàng)始人埃隆·馬斯克在社交平臺(tái)X上轉(zhuǎn)發(fā)相關(guān)消息時(shí)評(píng)價(jià)稱:"這展現(xiàn)了令人驚嘆的智能水平",該評(píng)論引發(fā)技術(shù)社區(qū)廣泛討論。業(yè)內(nèi)人士指出,此次開源的模型系列有望降低AI技術(shù)的落地門檻,為中小企業(yè)和開發(fā)者提供更多創(chuàng)新可能性。
據(jù)公開技術(shù)文檔顯示,Qwen3.5系列在訓(xùn)練階段引入了動(dòng)態(tài)數(shù)據(jù)增強(qiáng)技術(shù),通過自適應(yīng)調(diào)整訓(xùn)練樣本的復(fù)雜度,顯著提升了模型在少樣本學(xué)習(xí)場(chǎng)景下的表現(xiàn)。測(cè)試數(shù)據(jù)顯示,在多個(gè)基準(zhǔn)測(cè)試集中,該系列模型的關(guān)鍵指標(biāo)均達(dá)到行業(yè)領(lǐng)先水平,特別是在長(zhǎng)文本理解和多輪對(duì)話任務(wù)中表現(xiàn)突出。












