阿里巴巴正式推出全新一代開源大模型千問Qwen3.5-Plus,憑借多項技術創(chuàng)新在性能與性價比維度實現(xiàn)突破。該模型總參數規(guī)模達3970億,但通過極致稀疏架構設計,實際激活參數僅170億,在推理效率提升的同時,部署顯存占用降低60%,最大推理吞吐量較前代提升19倍。官方數據顯示,其API調用價格每百萬token低至0.8元,僅為同類產品Gemini 3 Pro的十八分之一。
技術架構層面,Qwen3.5-Plus實現(xiàn)四大核心突破。混合注意力機制通過動態(tài)分配計算資源,使模型在處理長文本時自動聚焦關鍵信息,突破傳統(tǒng)全量計算導致的算力瓶頸。極致稀疏MoE架構創(chuàng)新性地構建"專家子網絡"激活機制,僅用不足5%的參數即可調用全部知識儲備,在保持3970億參數規(guī)模的前提下,將推理成本降至行業(yè)新低。原生多Token預測能力讓模型具備"多步規(guī)劃"能力,推理速度較傳統(tǒng)逐token生成方式提升近一倍,特別在代碼補全、長文本生成等場景中實現(xiàn)"秒級響應"。系統(tǒng)級穩(wěn)定性優(yōu)化通過注意力門控、歸一化策略改進等技術手段,確保超大規(guī)模訓練的穩(wěn)定性,相關成果已獲NeurIPS 2025最佳論文獎。
在多模態(tài)交互領域,Qwen3.5-Plus展現(xiàn)出顛覆性能力。其視覺智能體技術突破傳統(tǒng)聊天機器人局限,可精準識別屏幕元素坐標與功能屬性,模擬點擊、滑動等操作。官方演示顯示,模型能在移動端跨應用完成信息提取、數據整理、流程自動化等復雜任務,在PC端實現(xiàn)多步驟辦公流程的自主執(zhí)行。跨應用協(xié)作能力打通數據孤島,例如自動從郵件提取信息、讀取表格數據后通過通訊軟件發(fā)送,這種"用戶代理"模式重新定義了人機協(xié)作范式。
視覺編程能力成為該模型另一技術亮點。在演示案例中,用戶僅需展示網頁設計草圖,模型即可在6分48秒內生成包含完整HTML/CSS/Javascript代碼的可用頁面,并自動匹配適配素材。這種"從草圖到產品"的轉化能力,源于模型對視覺元素與語義邏輯的深度理解——既能識別圓形代表按鈕、線條代表布局分隔,更能推斷"導航欄""內容區(qū)"等設計意圖。原生多模態(tài)架構使模型在預訓練階段即完成文本與視覺信息的深度融合,支持直接處理百萬級token的上下文窗口,相當于可完整解析兩小時視頻內容,并生成結構化文檔或代碼。
開發(fā)者生態(tài)建設同步推進,千問APP及PC端已完成模型接入,魔搭社區(qū)、HuggingFace平臺開放模型下載,阿里云百煉平臺提供API調用服務。性能評測顯示,Qwen3.5-Plus在推理、編程、Agent智能體等基準測試中全面領先,視覺理解能力獲多項權威評測第一,其以小勝大的技術路線為大規(guī)模模型發(fā)展提供全新思路。










