滾動資訊

當前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

阿里云Qwen3.5-Omni全模態(tài)大模型發(fā)布：多模態(tài)交互與離線能力全面升級

時間：2026-03-31 05:14:24 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

阿里云近日宣布推出Qwen3.5-Omni全模態(tài)大模型，作為Qwen系列最新力作，該模型在多模態(tài)理解與交互領(lǐng)域?qū)崿F(xiàn)突破性進展。其核心架構(gòu)采用Hybrid-Attention MoE混合注意力專家網(wǎng)絡(luò)，通過Thinker與Talker雙模塊協(xié)同處理復(fù)雜任務(wù)，支持文本、圖像、音頻及音視頻的跨模態(tài)理解與生成。

在模型規(guī)格方面，Qwen3.5-Omni系列提供Plus、Flash、Light三種尺寸的Instruct版本。其中旗艦版Plus版本具備256K長上下文處理能力，可一次性解析超過10小時的音頻數(shù)據(jù)或400秒的720P高清視頻。訓(xùn)練數(shù)據(jù)集涵蓋海量文本、視覺素材及超1億小時的音視頻素材，通過原生多模態(tài)預(yù)訓(xùn)練技術(shù)實現(xiàn)跨模態(tài)語義對齊。

語言能力實現(xiàn)質(zhì)的飛躍，新模型支持113種語言及方言的語音識別，覆蓋全球主要語言體系，同時具備36種語言的語音生成能力。在離線性能測試中，Qwen3.5-Omni-Plus在215項子任務(wù)中刷新SOTA紀錄，包括3個音視頻基準測試、5個音頻基準測試、8個自動語音識別（ASR）基準測試、156個語音到文本（S2TT）任務(wù)及43個ASR專項任務(wù)，全面超越Gemini-3.1 Pro的通用音頻處理能力。

該模型創(chuàng)新性地引入音視頻Caption生成技術(shù)，可自動生成包含時間戳、人物關(guān)系及場景描述的結(jié)構(gòu)化文本，支持視頻內(nèi)容的智能切片與標注。更值得關(guān)注的是，通過多模態(tài)Scaling技術(shù)，模型衍生出Audio-Visual Vibe Coding能力，能夠直接根據(jù)音視頻指令生成代碼，實現(xiàn)跨模態(tài)編程交互。

實時交互功能迎來重大升級，新模型支持五項核心特性：基于意圖識別的語義打斷功能可自動過濾無效背景音；集成WebSearch與復(fù)雜FunctionCall能力，支持自主決策是否調(diào)用外部資源；端到端語音控制系統(tǒng)允許用戶自由調(diào)節(jié)音量、語速及情緒表達；音色克隆技術(shù)支持用戶上傳音頻樣本定制專屬語音；ARIA動態(tài)對齊技術(shù)通過自適應(yīng)速率交錯編碼，徹底解決流式語音交互中的漏讀誤讀問題。

架構(gòu)設(shè)計方面，新模型延續(xù)Thinker-Talker雙引擎架構(gòu)，但將輸入處理機制升級為ARIA動態(tài)對齊模式。Thinker模塊通過Vision Encoder與Aut組件并行處理視覺與音頻信號，Talker模塊則負責多模態(tài)輸入整合與上下文感知的語音生成，這種設(shè)計使文本與語音單元的同步精度提升40%。

開發(fā)者可通過Qwen Chat、HuggingFace及ModelScope平臺體驗離線及實時演示，商業(yè)用戶可通過阿里云百煉平臺調(diào)用API接口。模型提供55種音色選擇，包括5個中英雙語主音色、19個場景化音色、8個中文方言音色及23個多語言音色，滿足不同場景的個性化需求。

更多>同類資訊

小米汽車第224集答網(wǎng)友問：聚焦女性安全、通透模式與電動尾翼新亮點

03-31

國行Apple智能深夜迎更新，Beta測試開啟，中文交互體驗升級

03-31

張雪：從修車學(xué)徒到世界賽事奪冠，“一根筋”造摩托的20年逐夢路

03-31

俞敏洪官宣東方甄選首店4月落地中關(guān)村，線下擴張能否開啟新篇章？

03-31

智元機器人3年造出10000臺！從手工作坊到工業(yè)級，未來或如手機般普及

03-31

雷軍發(fā)文紀念：小米造車五年，初心如磐再啟新程

03-31

中科院博士夏中譜加盟無界動力，以智駕經(jīng)驗助力具身智能技術(shù)突破與落地

03-31

雷軍宣布小米今年AI投入160億，AI人才招聘專項火熱開啟

03-31

vivo X300系列新品發(fā)布，價格上揚，換機是否必要引思考

首先看看 vivo X300s，它并沒有延續(xù) X300 的小屏設(shè)計，這次使用的是一塊 6.78 英寸 1.5K 分辨率 144Hz刷新率的京東方 Q10 基材直屏。X300s 相比上一代起售價漲了 800…

03-31

小米Watch S5正式開售！1199元起享超薄表體長續(xù)航，融入生態(tài)優(yōu)勢盡顯

新表擁有多個亮點，比如超薄表體、AMOLED屏幕、小米超級島、衛(wèi)星定位芯片、智能聯(lián)動、全新騎行模式、長續(xù)航等，對比其它智能手表，所擁有的亮點更豐富，而且融入小米生態(tài)，進一步提升新表優(yōu)勢。同時，搭載全新的雙頻…

03-31

iQOO Neo11小迭代來襲：天璣9500配8500mAh，性價比新選擇？

結(jié)合vivo X300s也是很強，搭載的是天璣9500+7100mAh+蔡司影像，起售價4799元，iQOO Neo11小迭代定位更低，不會內(nèi)部打架，但用戶可能會在加錢上X300s和省錢買Neo11之間猶豫…

03-31

vivo2026影像機皇X300 Ultra登場！起售價與小米17Ultra持平，頂配超萬元

vivo X300 Ultra 全球首發(fā)索尼 LYTIA-901 超大底主攝，35mm 蔡司人文紀實鏡頭，這一黃金焦段無需二次裁切即可直出 2億像素超清巨幅影像。硬件配置上，vivo X300 Ultr…

03-31

技術(shù)達人成功“喚醒”初代QQ 登錄界面重現(xiàn)早期互聯(lián)網(wǎng)簡約風

快科技3月30日消息，近日B站UP主“邊亮_網(wǎng)絡(luò)安全”發(fā)布視頻，稱其成功復(fù)活QQ第一版并實現(xiàn)登錄。這一操作勾起了眾多網(wǎng)友的青春回憶，也讓這款誕生于1999年的經(jīng)典即時通訊軟件再次走進大眾視野。博主透露，此…

03-31

小米17T系列通過FCC認證電池容量與快充升級連接存儲配置多樣

連接性方面，小米17T將支持5G網(wǎng)絡(luò)、WiFi 6E、藍牙、NFC及GNSS定位。該機將同時支持有線和無線反向充電，延續(xù)了前代特性。其中，小米17T的印度版本（型號“2602DPT53I”）已通過BIS認證…

03-31

聯(lián)想王帥遵義論道：萬類智聯(lián)邁向萬智互聯(lián)，虛商如何借Token東風啟新程

聯(lián)想集團副總裁、聯(lián)想懂的通信CEO王帥博士在會上發(fā)表《從萬類智聯(lián)到萬智互聯(lián)——全球虛商的分鐘、比特、Token之旅》主題演講，提出當前正處于“萬類智聯(lián)”進入“萬智互聯(lián)”的關(guān)鍵拐點，“智”從能力、工具、功能，正…

03-31

點擊查看更多 +

全站最新

龍蝦之父牽手百度：技術(shù)共鳴與生態(tài)共贏下的AI新棋局

比亞迪2025年成績斐然：營收納稅雙領(lǐng)先，技術(shù)賦能全球高端化進階

極兔（01519.HK）2025年報：經(jīng)調(diào)整凈利潤4.3億美元，步入價值驗證期

沃爾沃EC1500電動挖掘機斬獲金獎引領(lǐng)工程機械行業(yè)電動化新潮流

小米YU7 2月純電銷量超2萬奪冠華東多地受青睞高端市場競爭力凸顯

新小米SU7漲價4000元上市，鎖單量難及初代，產(chǎn)品升級能否重贏市場？

熱門內(nèi)容

本欄最新

龍蝦之父牽手百度：技術(shù)共鳴與生態(tài)共贏下的AI新棋局

小米YU7 2月純電銷量超2萬奪冠華東多地受青睞高端市場競爭力凸顯

新小米SU7漲價4000元上市，鎖單量難及初代，產(chǎn)品升級能否重贏市場？

雷軍發(fā)文紀念小米造車五周年：投入超400億，SU7系列成銷量冠軍

職場高效秘籍：科大訊飛智能辦公本選購攻略，多款機型助你輕松辦公

科大訊飛智能辦公本深度評測：AI賦能，打造高效辦公與學(xué)習(xí)新體驗

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

阿里云Qwen3.5-Omni全模態(tài)大模型發(fā)布：多模態(tài)交互與離線能力全面升級