阿里巴巴正式推出新一代開源大模型千問Qwen3.5-Plus,在性能評測中與Gemini 3 Pro持平,成為全球最強的開源模型。該模型總參數達3970億,但實際激活參數僅170億,通過架構創新實現了以小博大的技術突破。相較于前代Qwen3-Max萬億參數模型,新版本不僅性能更優,部署顯存占用降低60%,推理吞吐量最高可提升至19倍,且API調用價格降至每百萬Token 0.8元,僅為Gemini 3 Pro的十八分之一。
千問3.5系列最顯著的升級在于完成從純文本到原生多模態的范式轉變。不同于前代基于文本token的訓練方式,新模型采用視覺與文本混合token預訓練,數據集新增大量中英文、多語言、STEM學科及推理類內容。這種訓練方式使模型在保持參數規模縮減60%的同時,在MMLU-Pro知識推理(87.8分超越GPT-5.2)、GPQA博士級難題(88.4分領先Claude 4.5)等權威基準測試中全面領先。在指令遵循能力測試IFBench中,76.5分的成績更刷新了所有模型的歷史紀錄。
視覺能力的突破成為該模型的核心競爭力。在MathVison多模態推理、RealWorldQA視覺問答、CC_OCR文本識別等專項評測中,千問3.5均取得最佳成績。其空間智能模塊在RefCOCO-avg測試中表現尤為突出,能精準定位圖像中的微小物體并完成復雜推理。視頻理解方面支持長達2小時(100萬token上下文)的連續輸入,可自動生成視頻摘要。更值得關注的是,模型將視覺理解與代碼生成能力深度融合,用戶上傳手繪界面草圖即可自動生成前端代碼,截圖分析功能可快速定位并修復UI設計缺陷。
技術突破源于對Transformer架構的革命性改造。研發團隊將斬獲2025 NeurIPS最佳論文的門控技術融入新型混合架構,結合線性注意力機制與稀疏混合專家(MoE)模型,在保持3970億總參數規模的同時,將有效激活參數壓縮至170億。通過多token預測訓練和上下文優化技術,模型在32K標準場景下推理速度提升8.6倍,256K超長上下文場景下更達到19倍性能提升。訓練穩定性方面,創新設計的FP8/FP32混合精度策略使內存占用減少50%,訓練效率提升10%。
原生多模態訓練的高效實施得益于阿里云AI基礎設施的支撐。通過數據流優化技術,模型在文本、圖像、視頻混合訓練時的吞吐量接近純文本模型水平,顯著降低多模態訓練門檻。在商業化應用層面,千問3.5已實現從框架到應用的實質性突破。移動端支持主流APP自動化操作,PC端可完成跨應用數據整理、復雜流程執行等任務。其異步強化學習框架將Agent訓練效率提升3-5倍,插件式智能體支持規模擴展至百萬級。
春節期間,基于千問3.5的AI購物Agent完成1.2億筆訂單處理,驗證了大規模真實場景商用能力。自2023年開源以來,千問系列已推出400余個模型版本,覆蓋全尺寸、全模態領域,全球下載量突破10億次,單月下載量超過DeepSeek、meta、OpenAI等六家企業總和。開發者基于千問開發的衍生模型超過20萬個,形成全球最大的開源模型生態。最新版本擴展支持201種語言,詞表容量從15萬擴展至25萬,小語種編碼效率提升最高達60%。目前,千問APP及PC端已完成模型接入,開發者可通過魔搭社區、HuggingFace平臺下載,或通過阿里云百煉獲取API服務,后續將陸續開源不同規格的千問3.5系列模型。







