滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

阿里Qwen3.5-Omni全模態大模型來襲！實測50分鐘視頻，解鎖“用嘴編程”新技能

時間：2026-04-02 02:05:47 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

阿里巴巴近日正式發布新一代全模態大模型Qwen3.5-Omni，標志著多模態人工智能技術邁入新階段。該模型突破傳統單一模態限制，支持文本、圖像、音頻及音視頻的混合輸入與輸出，其中音頻輸出與文本輸出可同步生成，為智能交互領域帶來全新可能。

技術團隊披露，Qwen3.5-Omni系列包含Plus、Flash、Light三種規格模型，最大支持256k長上下文處理能力。在音頻處理方面，該模型可連續解析超過10小時的語音內容，音視頻輸入時長擴展至400秒（720P分辨率，1幀/秒）。經實測驗證，模型在215項多模態任務中刷新多項最佳紀錄，其音頻理解、推理及翻譯能力已超越Gemini-3.1 Pro，音視頻綜合處理水平與之持平。

該模型最引人注目的創新在于"視聽編程"能力。在演示場景中，用戶通過手機攝像頭拍攝手繪草圖并語音描述需求，模型即可實時生成對應的前端代碼。當測試團隊上傳50分鐘美劇《老友記》時，系統在1分鐘內完成全片解析，不僅精準標注時間軸與人物關系，還能識別關鍵劇情轉折點。更令人驚嘆的是，模型可根據游戲直播畫面自動檢測違規內容，展現出色的多模態內容審核能力。

方言支持成為另一大亮點。模型現已兼容39種中國方言與74種外語的語音識別，可合成7種方言及29種語言的語音輸出。在閩南語對話測試中，系統準確理解方言語義并生成地道語音回應，僅在極少數專業詞匯上自動切換普通話。配合實時網絡搜索功能，模型甚至能主動提供當日天氣等動態信息，整個交互過程延遲控制在1-2秒。

交互體驗實現質的飛躍。新模型引入語義打斷機制，允許用戶在系統"說話"時隨時插入新指令，模型可智能區分有效指令與背景噪音。通過整合端到端語音控制技術，用戶能直接調節輸出語音的音量、語速甚至情緒表達。更突破性的是音色克隆功能，用戶上傳30秒語音樣本后，模型即可復現該音色并完成多語言轉換，在交替傳譯場景中實現聲紋保持。

技術架構方面，Qwen3.5-Omni延續Thinker-Talker分工模式但進行全面升級。Thinker模塊采用混合注意力MoE架構，通過TMRoPE編碼技術實現長序列高效處理；Talker模塊引入RVQ編碼替代傳統DiT運算，配合ARIA自適應對齊技術，使語音合成穩定性提升40%。經基準測試，新模型在長音頻處理效率較前代提升3倍，音視頻理解任務響應速度加快2.5倍。

該模型已開放API調用服務，支持離線與實時兩種模式。定價體系采用階梯計費，128k以下輸入場景中，音頻處理價格為4.96元/百萬tokens，文本/圖像/視頻輸入為0.8元/百萬tokens。輸出端文本+音頻綜合價格為61.322元/百萬tokens，純文本輸出降至9.6元/百萬tokens。開發者可通過阿里云百煉平臺、魔搭社區及Hugging Face等渠道體驗模型能力。

更多>同類資訊

雷軍4月2日晚19時開啟拆車直播，深度剖析小米新SU7全方位細節

月 1 日消息，今天午間，小米汽車官微宣布：4 月 2 日 19 時 ~24 時，雷軍準備了一場拆車直播，拆一臺新 SU7。據IT之家了解，小米新一代 SU7 車型于 3 月 23 日正式開啟交付，當日上午…

04-02

雷軍4月2日晚開啟5小時直播深度拆解2026款小米SU7各細節

來源：環球網【環球網科技綜合報道】4月1日消息，小米集團創辦人、董事長兼CEO雷軍通過社交媒體公布，其將于4月2日19:00至24:00開啟一場長達5小時的“拆車直播”。在這場直播中，雷軍將親自帶領技術…

04-02

小米新一代SU7上市表現亮眼首周交付超7000臺備產充足銷量可期

4月1日，小米汽車宣布，2026年3月，小米汽車交付量超過20000臺，新一代SU7，自3月23日開啟交付起，累計交付已超7000臺。新一代小米SU7于3月19日正式發布，售價21.99萬起，憑借硬核安全設…

04-02

小米YU7 GT紐北賽道展實力，高性能配置拉滿，能否沖擊量產SUV圈速榜首？

作為參考，目前位居紐博格林北環量產SUV圈速榜第一的是奧迪RSQ8Performance，成績為7分36秒698。根據此前官方消息，小米SU7Ultra原型車紐北圈速6:22.091，總榜第三；量產車7:04…

04-02

特斯拉“王牌廠長”宋鋼或加盟小米，助力小米汽車攻克產能交付難關

宋鋼在特斯拉積累的從零開始建廠、快速產能爬坡、以及應對“產能地獄”的實戰經驗，將直接幫助小米汽車優化生產流程、提升效率、保障質量一致性，這是實現55萬輛年交付目標的根本保障。（）值得一提的是，今天我們還得到消…

04-02

武漢蘿卜快跑系統故障致車輛熄火，乘客高架滯留數小時等救援

3月31日晚20時起，百度旗下蘿卜快跑因系統故障，導致多輛自動駕駛車輛于武漢市內高架環線熄火停駛，引發嚴重交通擁堵及事故。據網友反映，現場多車并排停滯在最左側車道，造成三股車道被壓縮至一股，部分區域擁堵達…

04-02

從萌芽到領跑：廣州游戲產業20年狂飆，年營收1532億鑄就“中國第一城”傳奇

04-02

Maison Margiela首登上海時裝周，與小米跨界合作秀場亮點搶先看

04-02

AI賦能內容生態新飛躍：快手以可靈AI開啟第二增長曲線

04-02

張雪機車WSBK奪冠：從修車學徒到身價7億，資本與品牌共狂歡

04-02

牛奶界“新花樣”大賞：非均質、A2奶、水牛奶……總有一款戳中你

04-02

小米汽車引入特斯拉前高管孔艷雙，補強銷售體系助力規模化交付

04-02

從應急到正餐：康師傅如何以創新重塑方便面，穩坐國人餐桌“C位”？

04-01

何享健“放手”交班方洪波：徹底放權下美的如何實現逆勢增長？

04-01

電解質水賽道激戰正酣：農夫山泉入局，誰能在這場巨頭博弈中突圍？

04-01

點擊查看更多 +

全站最新

因湃電池擬IPO：從廣汽自產項目到動力電池儲能賽道競逐者

小米YU7 GT紐北賽道展實力，高性能配置拉滿，能否沖擊量產SUV圈速榜首？

武漢蘿卜快跑系統故障致車輛熄火，乘客高架滯留數小時等救援

公告精選︱滬電股份：擬68億元投建印制電路板生產項目及其配套設施；江順科技：未向海外公司寄送數據中心液冷板樣

美股存儲芯片概念股集體大漲

光明乳業解鎖上海專屬味道，"梧桐樹下享濃上海"新品首發

熱門內容

本欄最新

銅文創：借IP與國潮“破圈”，卻難逃成本、結構掣肘成“泡泡瑪特”難？

字節Seed大模型校招全球攬才 2027屆AI新秀將獲高起點與廣闊成長空間

2026美妝行業新動向：精準細分、場景拓展等引領消費新潮流

網易智企阮良：企業擁抱AI正當時，用錯可調不用則錯失時代機遇

奧迪車主與雷軍打賭后購小米SU7，上汽奧迪大氣喊話：隨時歡迎回歸比腳感

字節Seed大模型校招全球啟幕招募百位AI精英共探智能新邊界

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

阿里Qwen3.5-Omni全模態大模型來襲！實測50分鐘視頻，解鎖“用嘴編程”新技能