春節(jié)前夕,阿里再次在AI領(lǐng)域投下一枚重磅炸彈——新一代開源大模型Qwen3.5正式發(fā)布。這款被業(yè)界稱為"反直覺"的模型,以3970億參數(shù)的"瘦身"姿態(tài),實(shí)現(xiàn)了對(duì)萬億參數(shù)前代旗艦Qwen3-Max的性能超越,更在效率與成本維度展現(xiàn)出顛覆性優(yōu)勢。
在開源社區(qū),Qwen系列早已成為技術(shù)風(fēng)向標(biāo)。從Qwen1.5首創(chuàng)細(xì)粒度專家模式,到Qwen3摒棄沿用三代的共享專家架構(gòu)轉(zhuǎn)用路由專家,再到此次Qwen3.5引入混合注意力機(jī)制實(shí)現(xiàn)"有詳有略"的信息處理,這個(gè)中國團(tuán)隊(duì)始終在自我革新中推動(dòng)行業(yè)進(jìn)步。最新發(fā)布的Qwen3.5-Plus尤為引人注目:其激活參數(shù)僅170億,相當(dāng)于用5%的算力資源調(diào)動(dòng)滿血智能,最終交付的token成本僅為Gemini 3 Pro的1/18。
技術(shù)突破的背后是扎實(shí)的學(xué)術(shù)支撐。推動(dòng)Qwen3.5實(shí)現(xiàn)質(zhì)變的門控技術(shù),源自阿里團(tuán)隊(duì)在2025 NeurIPS頂會(huì)上斬獲最佳論文的成果。這項(xiàng)被業(yè)界評(píng)價(jià)為"重新定義模型效率"的技術(shù),現(xiàn)已完全開源,任何科技公司均可直接吸收應(yīng)用。這種開放姿態(tài),讓中國開源模型陣營形成獨(dú)特優(yōu)勢——Qwen、GLM、Kimi、DeepSeek等模型構(gòu)成的多維度技術(shù)矩陣,正在對(duì)閉源模型形成全面包圍之勢。
全模態(tài)能力的突破成為另一大亮點(diǎn)。Qwen3.5從預(yù)訓(xùn)練階段就采用文本與視覺混合數(shù)據(jù)聯(lián)合學(xué)習(xí),使視覺與語言在統(tǒng)一參數(shù)空間深度融合。這種技術(shù)路徑與Gemini 3 Pro等國際頂尖模型異曲同工,但中國團(tuán)隊(duì)展現(xiàn)出更快的迭代速度。有開發(fā)者實(shí)測顯示,當(dāng)前國產(chǎn)大模型與全球SOTA的差距已從6個(gè)月縮短至3個(gè)月,某些細(xì)分領(lǐng)域甚至實(shí)現(xiàn)反超。
阿里在AI領(lǐng)域的戰(zhàn)略布局正顯現(xiàn)出獨(dú)特價(jià)值。作為全球少數(shù)同時(shí)具備芯片、云計(jì)算、大模型和應(yīng)用開發(fā)能力的科技公司,其技術(shù)棧的完整性曾被比作"中國版谷歌"。隨著Qwen3.5在多模態(tài)領(lǐng)域的突破,這種對(duì)比正在從業(yè)務(wù)架構(gòu)層面延伸至技術(shù)實(shí)力維度。當(dāng)行業(yè)還在討論"追趕"時(shí),中國團(tuán)隊(duì)已用持續(xù)的技術(shù)爆發(fā)改寫著游戲規(guī)則。
在這個(gè)辭舊迎新的時(shí)刻,開源社區(qū)的開發(fā)者們正用代碼慶祝這場技術(shù)盛宴。有人戲稱:"阿里選擇在除夕前發(fā)新模型,這是要給全球AI圈送'技術(shù)年夜飯'。"而更多人開始期待:當(dāng)開源模型摘下"無定語SOTA"桂冠時(shí),是否會(huì)成為改變行業(yè)格局的關(guān)鍵轉(zhuǎn)折點(diǎn)?











