滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

阿里千問Qwen3-TTS多碼本全系列模型開源助力語音生成技術新突破

時間：2026-01-23 04:33:49 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

千問團隊近日宣布，其自主研發的Qwen3-TTS多碼本全系列語音生成模型正式開源，包含1.7B參數和0.6B參數兩個版本。其中1.7B版本在性能表現上達到行業頂尖水平，0.6B版本則實現了性能與效率的平衡優化。該系列模型已通過GitHub平臺開放下載，同時提供Qwen API接口供開發者體驗。

作為新一代語音生成技術，Qwen3-TTS突破性地采用離散多碼本語言模型架構，通過自研的Qwen3-TTS-Tokenizer-12Hz語音編碼器，實現了對語音信號的高效壓縮與語義建模。該技術不僅完整保留了語氣、語調等副語言信息，還能在非擴散變換器（非DiT）架構下完成高保真語音重建。實驗數據顯示，其端到端合成延遲最低可達97毫秒，支持在輸入單個字符后立即生成音頻流。

在功能實現方面，該模型系列展現出三大核心優勢：其一，支持跨語言音色克隆與創造，覆蓋中、英、日、韓等十種主流語言及多種方言；其二，具備智能語音控制能力，可通過自然語言指令調節音色、情感、節奏等參數；其三，創新采用Dual-Track雙軌建模技術，使單個模型同時兼容流式與非流式生成模式。特別在長語音生成場景中，模型可一次性合成10分鐘音頻，中英文混合語料的詞錯率分別控制在2.36%和2.81%。

技術評估顯示，Qwen3-TTS在多個專項任務中達到國際領先水平。在音色創造任務中，其VoiceDesign模塊在指令遵循準確率和生成表現力方面超越MiniMax閉源模型；在音色控制任務中，Instruct模塊取得75.4%的評估分數，同時保持2.34%的平均詞錯率；在跨語言音色克隆任務中，VoiceClone模塊在10個語種測試集中取得1.835%的平均詞錯率和0.789的說話人相似度。這些指標均優于同期發布的CosyVoice3等開源模型。

語音編碼器的性能驗證同樣亮眼。在LibriSpeech標準測試集中，Qwen-TTS-Tokenizer的感知語音質量評估（PESQ）得分達寬帶3.21/窄帶3.68，短時客觀可懂度（STOI）達0.96，語音質量評估（UTMOS）達4.16，說話人相似度評估達0.95。這些數據表明，該編碼器在語音重構質量、信息保留完整度等關鍵指標上均處于行業前沿。

目前，開發者可通過GitHub獲取完整模型代碼與訓練數據集，或直接調用Qwen API進行快速集成。該系列模型的開源將顯著降低語音生成技術的研發門檻，為智能客服、有聲內容制作、無障礙交互等領域提供新的技術解決方案。據團隊透露，后續將持續優化模型在低資源設備上的部署效率，并擴展更多語言的支持能力。

更多>同類資訊

消息稱字節跳動正洽談出售游戲部門沐瞳科技，估值超60億美元

02-14

Meta計劃為Ray-Ban智能眼鏡引入面部識別技術，有望強化AI助手

02-14

新能源電機功率大比拼：國產車強勢崛起，性能與性價比如何權衡？

02-14

小米汽車22個月交付60萬臺，從跨界新秀到行業先鋒的逆襲之路

02-14

美國“龍”飛船啟程赴國際空間站 4名宇航員將開展8個月科研任務

02-14

歐洲阿麗亞娜64火箭首飛告捷 32顆亞馬遜Leo衛星成功送入近地軌道

02-14

2025年12月尼爾森IQ快消月報：市場分化明顯，線上成增長主力

渠道層面，線上線下走勢截然不同，線上成為全年增長主力，2025年1-12月線上整體增幅達16.7%，其中綜合電商、內容電商均實現增長，線下各渠道則悉數小幅下滑，僅便利店展現出較好的抗跌性。品類表現上，全年…

02-14

《不死帝師》：以長生之筆繪就情感哲思畫卷領跑春節檔短劇市場

02-14

xAI遭集體訴訟

02-14

Gemini 加持，Google Docs 新增「語音摘要」功能

02-14

大漲320%后，消息稱「全球大模型第一股」智譜計劃赴滬二次上市

02-14

雷軍：新一代SU7展車今日到店

02-14

半畝花田沖擊港股上市：平價網紅能否破局，開啟新增長篇章？

02-14

2026春節檔AI激戰：大模型廠商競逐AI編程與智能體新賽道

02-14

Meta擬為Ray-Ban智能眼鏡添面部識別，扎克伯格欲借“識人”搶占AI眼鏡市場

02-13

點擊查看更多 +

全站最新

魏建軍再發聲確認合作進展長城與FF攜手開拓北美市場迎新突破

比亞迪宋PLUS：以硬核實力鑄就銷量傳奇，引領中國新能源SUV新風潮

沃爾沃SPA3平臺突破傳統束縛低底盤純電轎車與旅行車或迎“新生”

智電時代穩健前行，一汽豐田以多元布局與創新驅動開啟新征程

問界M6內飾諜照引熱議！運動科技雙升級 25萬級市場或迎新爆款

新款Jeep Avenger冬季測試諜照流出 2027年發布內飾動力全面升級

熱門內容

本欄最新

2025年12月尼爾森IQ快消月報：市場分化明顯，線上成增長主力

半畝花田沖擊港股上市：平價網紅能否破局，開啟新增長篇章？

吉利新能源再發力，銀河M7或攜高性價比入場，緊湊級插混SUV迎新格局

百度優選電商Skill上架ClawHub，五大核心模塊助力主流品類消費升級

AI技術突破重塑生活，投融界助力創業者掘金新賽道新機遇

2025年小米汽車200+功能煥新升級，車主最鐘愛的十大功能榜單揭曉

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

阿里千問Qwen3-TTS多碼本全系列模型開源 助力語音生成技術新突破

阿里千問Qwen3-TTS多碼本全系列模型開源助力語音生成技術新突破