阿里巴巴近日宣布開源新一代大模型千問Qwen3.5-Plus,其性能已達到國際頂尖水平,可與Gemini 3Pro相媲美。這一成果標志著中國在開源大模型領域再次取得重大突破,成為全球開發者關注的焦點。該模型總參數達3970億,但實際激活參數僅170億,通過創新架構實現了以小博大的技術突破,不僅性能超越萬億參數的Qwen3-Max模型,還將部署顯存占用降低60%,推理效率顯著提升,最大推理吞吐量可達原模型的19倍。
在基準測試中,千問3.5-Plus展現出了卓越的綜合能力。MMLU-Pro知識推理評測得分87.8分,超越GPT-5.2;博士級難題GPQA測評斬獲88.4分,高于Claude 4.5;指令遵循IFBench以76.5分刷新紀錄。在通用Agent評測BFCL-V4和搜索Agent評測Browsecomp等專項測試中,其表現均優于Gemini 3 Pro和GPT-5.2。更令人矚目的是,該模型API價格每百萬Token僅0.8元,僅為Gemini 3Pro的十八分之一,大幅降低了開發者的使用成本。
技術層面,千問3.5-Plus實現了從純文本到原生多模態的代際躍遷。通過視覺和文本混合token預訓練,模型新增了大量中英文、多語言、STEM和推理數據,使其具備更強的世界知識理解和推理能力。在多模態推理、通用視覺問答、文本識別、空間智能、視頻理解等權威評測中均取得最佳成績。特別是在視頻理解方面,該模型支持長達2小時的視頻直接輸入,適用于長視頻內容分析與摘要生成,為視頻處理領域帶來新的可能性。
視覺編程能力的突破是千問3.5-Plus的另一大亮點。該模型實現了視覺理解與代碼能力的原生融合,結合圖搜和生圖工具,可將手繪界面草圖直接轉換為可用的前端代碼,還能通過截圖定位并修復UI問題。這種能力使視覺編程真正成為生產力工具,為開發者提供了更高效的工作方式。在學科解題、任務規劃與物理空間推理等任務上,其表現優于千問專項模型Qwen3-VL,空間定位推理和帶圖推理能力顯著增強。
模型效率的提升得益于對Transformer架構的創新突破。千問團隊將自研的門控技術(曾獲2025NeurIPS最佳論文)與線性注意力機制、稀疏混合專家MoE模型架構相結合,實現了397B總參數激活僅17B的極致效率。通過訓練穩定優化和多token預測等技術,千問3.5-Plus在32K上下文場景中推理吞吐量提升8.6倍,在256K超長上下文情況下最大提升19倍,推理效率達到行業領先水平。
這些技術突破離不開阿里云AI基礎設施的支持。千問3.5-Plus在文本、圖像、視頻等混合數據訓練吞吐量上,幾乎與純文本基座模型持平,大幅降低了原生多模態訓練的難度。通過精巧的FP8、FP32精度應用策略,模型在訓練穩定擴展到數十萬億個token時,激活內存減少約50%,訓練速度提升10%,有效節約了訓練成本。
在應用層面,千問3.5-Plus已展現出強大的商業化潛力。基于該模型的AI購物Agent在春節期間6天內幫助用戶完成1.2億筆訂單,實現了大規模真實世界任務執行和商業化驗證。該Agent可自主操作手機與電腦,支持更多主流APP與指令,在PC端能處理復雜的多步驟操作,如跨應用數據整理和自動化流程執行。千問團隊還構建了可擴展的Agent異步強化學習框架,端到端加速3到5倍,插件式智能體支持擴展至百萬級規模。
自2023年開源以來,阿里已推出400多個千問模型,覆蓋全尺寸、全模態,全球下載量突破10億次,單月下載量超過DeepSeek、meta、OpenAI等企業2至8名的總和。開發者基于千問開發的衍生模型超過20萬個,使其成為公認的全球第一開源模型。為滿足不同國家開發者和企業的需求,千問3.5-Plus擴展支持201種語言,詞表大小從15萬擴展到25萬,小語種編碼效率最高提升60%。目前,千問APP和PC端已接入新模型,開發者可在魔搭社區和HuggingFace下載,或通過阿里云百煉獲取API服務。阿里計劃繼續開源不同尺寸、功能的千問3.5系列模型,性能更強的旗艦模型Qwen3.5-Max也將于近期發布。










