阿里巴巴近日宣布開源新一代大模型千問Qwen3.5-Plus,這款模型在性能上已與Gemini 3 Pro比肩,成為全球開源模型領域的佼佼者。Qwen3.5-Plus不僅在底層架構上實現了全面革新,更在參數規模與效率之間找到了新的平衡點——總參數達3970億,但激活參數僅170億,卻超越了萬億參數的Qwen3-Max模型。其顯存占用降低60%,推理效率顯著提升,最大推理吞吐量可提升至19倍,且API價格每百萬Token低至0.8元,僅為Gemini 3 Pro的1/18,為開發者提供了更高性價比的選擇。
與前代模型相比,千問3.5完成了從純文本到原生多模態的跨越式發展。其預訓練數據不再局限于文本,而是融入了視覺與文本混合token,并大幅增加了中英文、多語言、STEM及推理等數據。這一變革使模型具備了更密集的世界知識和推理邏輯,在推理、編程、Agent智能體等全方位基準評估中表現優異。例如,在MMLU-Pro知識推理評測中得分87.8分,超越GPT-5.2;在博士級難題GPQA測評中斬獲88.4分,高于Claude 4.5;在指令遵循IFBench中以76.5分刷新紀錄;在通用Agent評測BFCL-V4、搜索Agent評測Browsecomp等基準中,均超越Gemini 3 Pro和GPT-5.2。
原生多模態訓練為千問3.5帶來了視覺能力的飛躍。在多模態推理、通用視覺問答、文本識別、空間智能、視頻理解等權威評測中,該模型均取得最佳性能。其空間定位推理和帶圖推理能力顯著增強,推理分析更精細;支持長達2小時的視頻直接輸入,適用于長視頻內容分析與摘要生成;同時實現了視覺理解與代碼能力的原生融合,可將手繪界面草圖轉為前端代碼,或通過截圖定位并修復UI問題,真正將視覺編程轉化為生產力工具。
千問3.5的性能突破源于對Transformer架構的創新。千問團隊自研的門控技術曾獲2025 NeurIPS最佳論文,該技術被融入混合架構中,結合線性注意力機制與稀疏混合專家MoE模型,實現了397B總參數激活僅17B的極致效率。通過訓練穩定優化和多token預測技術,Qwen3.5在保持與Qwen3-Max性能持平的同時,進一步提升了推理效率:在32K上下文場景中推理吞吐量提升8.6倍,在256K超長上下文情況下最大提升至19倍。
這一成果得益于阿里云AI基礎設施的支持。千問3.5在文本、圖像、視頻混合數據訓練吞吐量上接近純文本基座模型水平,大幅降低了原生多模態訓練門檻。通過FP8、FP32精度應用策略,訓練穩定擴展至數十萬億token時,激活內存減少約50%,訓練速度提升10%,進一步節約了成本。基于頂級視覺能力,千問3.5在Agent應用領域實現新突破:可自主操作手機與電腦,支持更多主流APP與復雜指令,在PC端能處理跨應用數據整理、自動化流程執行等任務;團隊構建的異步強化學習框架將端到端加速3至5倍,插件式智能體支持擴展至百萬級規模。
1月15日,千問App發布全球首個消費級AI購物Agent,春節期間6天內協助用戶完成1.2億筆訂單,首次實現大規模真實世界任務執行與商業化驗證。隨著Qwen3.5-Plus的接入,千問APP在工作與生活場景中的服務能力將進一步拓展。自2023年開源以來,阿里已發布400多個千問模型,覆蓋全尺寸、全模態,全球下載量突破10億次,單月下載量超過DeepSeek、meta、OpenAI等企業2至8倍的總和,衍生模型超20萬,成為開發者最友好的開源生態。為滿足不同國家需求,千問3.5擴展支持201種語言,詞表從15萬增至25萬,小語種編碼效率提升最高60%。目前,千問APP、PC端已接入Qwen3.5-Plus,開發者可通過魔搭社區、HuggingFace下載模型,或通過阿里云百煉獲取API服務。阿里計劃后續開源不同尺寸、功能的千問3.5系列模型,性能更強的Qwen3.5-Max也將于近期發布。












