阿里巴巴近日宣布開源全新一代大模型千問Qwen3.5-Plus,該模型在性能上與Gemini 3 Pro不相上下,成為全球開源模型中的佼佼者。此次發(fā)布的Qwen3.5-Plus版本總參數(shù)高達3970億,但激活參數(shù)僅為170億,實現(xiàn)了以小博大的技術突破。其性能不僅超越了萬億參數(shù)的Qwen3-Max模型,還在部署顯存占用上降低了60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API價格極具競爭力,每百萬Token僅需0.8元,僅為Gemini 3 Pro的1/18。
與前幾代千問大語言模型相比,Qwen3.5-Plus實現(xiàn)了從純文本模型到原生多模態(tài)模型的重大轉(zhuǎn)變。千問3主要在純文本Tokens上進行預訓練,而Qwen3.5-Plus則基于視覺和文本混合token進行預訓練,并大幅增加了中英文、多語言、STEM和推理等數(shù)據(jù)。這使得模型能夠“睜開眼睛”看世界,掌握更密集的世界知識和推理邏輯。在推理、編程、Agent智能體等全方位基準評估中,Qwen3.5-Plus均表現(xiàn)出色,例如在MMLU-Pro知識推理評測中得分87.8分,超越GPT-5.2;在博士級難題GPQA測評中斬獲88.4分,高于Claude 4.5。
原生多模態(tài)訓練也顯著提升了Qwen3.5-Plus的視覺能力。在多模態(tài)推理、通用視覺問答VQA、文本識別和文件理解、空間智能、視頻理解等眾多權(quán)威評測中,Qwen3.5-Plus均取得了最佳性能。特別是在視頻理解方面,該模型支持長達2小時的視頻直接輸入,適用于長視頻內(nèi)容分析與摘要生成。同時,Qwen3.5-Plus還實現(xiàn)了視覺理解與代碼能力的原生融合,能夠?qū)⑹掷L界面草圖直接轉(zhuǎn)為可用的前端代碼,一張截圖就能定位并修復UI問題,極大地提高了視覺編程的效率。
Qwen3.5-Plus性能的飛躍,得益于對Transformer經(jīng)典架構(gòu)的重大創(chuàng)新。千問團隊自研的門控技術成果曾獲得全球AI頂會2025 NeurIPS最佳論文,該技術已融入到Qwen3.5-Plus的創(chuàng)新混合架構(gòu)中。團隊結(jié)合線性注意力機制與稀疏混合專家MoE模型架構(gòu),實現(xiàn)了397B總參數(shù)激活僅17B的極致模型效率。通過訓練穩(wěn)定優(yōu)化以及多token預測等系列技術,Qwen3.5-Plus的性能與Qwen3-Max模型持平,并進一步提升了推理效率。在常用的32K上下文場景中,推理吞吐量可提升8.6倍;在256K超長上下文情況下,推理吞吐量最大可提升至19倍。
Qwen3.5-Plus的原生多模態(tài)訓練是在阿里云AI基礎設施上高效完成的。通過系列基礎技術創(chuàng)新,該模型在文本、圖像、視頻等混合數(shù)據(jù)訓練吞吐量上,幾乎與純文本基座模型訓練持平,大大降低了原生多模態(tài)訓練的難度門檻。同時,通過設計精巧的FP8、FP32精度應用策略,在訓練穩(wěn)定擴展到數(shù)十萬億個token時,激活內(nèi)存減少約50%,訓練還能提速10%,進一步節(jié)約了模型訓練成本、提升了訓練效率。
基于強大的視覺能力,Qwen3.5-Plus在Agent框架和應用方面也取得了新突破。該模型可自主操作手機與電腦,高效完成日常任務,在移動端支持更多主流APP與指令,在PC端可處理更復雜的多步驟操作,如跨應用數(shù)據(jù)整理、自動化流程執(zhí)行等。千問團隊還構(gòu)建了一個可擴展的Agent異步強化學習框架,端到端可加速3到5倍,并將插件式智能體Agent支持擴展至百萬級規(guī)模。1月15日,千問App發(fā)布了全球首個消費級AI購物Agent,春節(jié)期間6天時間幫用戶完成了1.2億筆訂單,在全球首次實現(xiàn)大規(guī)模真實世界任務執(zhí)行和商業(yè)化驗證。
自2023年開源以來,阿里巴巴已開源400多個千問模型,覆蓋全尺寸、全模態(tài),全球下載量突破10億次。單月下載量方面,千問是DeepSeek、meta、OpenAI、智譜、Kimi、MiniMax等2到8名總和,開發(fā)者基于千問開發(fā)的衍生模型超20萬,成為公認的全球第一開源模型,也是開發(fā)者最友好的開源大模型。面向不同國家的AI開發(fā)者和企業(yè)的需求,千問大模型還在持續(xù)演進,Qwen3.5-Plus已擴展支持201種語言,將詞表大小從15萬擴展到25萬,可最高提升小語種60%的編碼效率。據(jù)悉,千問APP、PC端已第一時間接入Qwen3.5-Plus模型,開發(fā)者可在魔搭社區(qū)和HuggingFace下載新模型,或通過阿里云百煉直接獲取API服務。阿里巴巴還將繼續(xù)開源不同尺寸、不同功能的千問3.5系列模型,性能更強的旗艦模型Qwen3.5-Max不久也將發(fā)布。









