岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

阿里千問Qwen3-TTS多碼本全系列模型開源 助力語音生成技術新突破

   時間:2026-01-23 04:33:49 來源:互聯網編輯:快訊 IP:北京 發表評論無障礙通道
 

千問團隊近日宣布,其自主研發的Qwen3-TTS多碼本全系列語音生成模型正式開源,包含1.7B參數和0.6B參數兩個版本。其中1.7B版本在性能表現上達到行業頂尖水平,0.6B版本則實現了性能與效率的平衡優化。該系列模型已通過GitHub平臺開放下載,同時提供Qwen API接口供開發者體驗。

作為新一代語音生成技術,Qwen3-TTS突破性地采用離散多碼本語言模型架構,通過自研的Qwen3-TTS-Tokenizer-12Hz語音編碼器,實現了對語音信號的高效壓縮與語義建模。該技術不僅完整保留了語氣、語調等副語言信息,還能在非擴散變換器(非DiT)架構下完成高保真語音重建。實驗數據顯示,其端到端合成延遲最低可達97毫秒,支持在輸入單個字符后立即生成音頻流。

在功能實現方面,該模型系列展現出三大核心優勢:其一,支持跨語言音色克隆與創造,覆蓋中、英、日、韓等十種主流語言及多種方言;其二,具備智能語音控制能力,可通過自然語言指令調節音色、情感、節奏等參數;其三,創新采用Dual-Track雙軌建模技術,使單個模型同時兼容流式與非流式生成模式。特別在長語音生成場景中,模型可一次性合成10分鐘音頻,中英文混合語料的詞錯率分別控制在2.36%和2.81%。

技術評估顯示,Qwen3-TTS在多個專項任務中達到國際領先水平。在音色創造任務中,其VoiceDesign模塊在指令遵循準確率和生成表現力方面超越MiniMax閉源模型;在音色控制任務中,Instruct模塊取得75.4%的評估分數,同時保持2.34%的平均詞錯率;在跨語言音色克隆任務中,VoiceClone模塊在10個語種測試集中取得1.835%的平均詞錯率和0.789的說話人相似度。這些指標均優于同期發布的CosyVoice3等開源模型。

語音編碼器的性能驗證同樣亮眼。在LibriSpeech標準測試集中,Qwen-TTS-Tokenizer的感知語音質量評估(PESQ)得分達寬帶3.21/窄帶3.68,短時客觀可懂度(STOI)達0.96,語音質量評估(UTMOS)達4.16,說話人相似度評估達0.95。這些數據表明,該編碼器在語音重構質量、信息保留完整度等關鍵指標上均處于行業前沿。

目前,開發者可通過GitHub獲取完整模型代碼與訓練數據集,或直接調用Qwen API進行快速集成。該系列模型的開源將顯著降低語音生成技術的研發門檻,為智能客服、有聲內容制作、無障礙交互等領域提供新的技術解決方案。據團隊透露,后續將持續優化模型在低資源設備上的部署效率,并擴展更多語言的支持能力。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 外国av网站| 午夜视频网站 | 最新日韩av在线 | 久久国产成人 | 精品成人一区二区三区 | 男人天堂手机在线 | 精品1卡二卡三卡四卡老狼 亚洲网在线观看 | 麻豆网址 | 中文在线资源天堂 | 日本黄色短视频 | 午夜精品福利在线观看 | 久草福利在线观看 | 97久久精品人人澡人人爽 | 国产永久免费观看 | 97视频人人 | 日韩精品999 | 91免费视频网站 | 日本另类 | 羞羞网站免费 | 欧美日韩一区三区 | 日本不卡视频一区二区 | 久久综合网址 | 亚洲精品第二页 | 午夜免费视频 | 亚洲欧洲av | 这里有精品视频 | 九九热国产视频 | 日韩精品一区二区在线观看 | 91精品福利视频 | 麻豆国产91在线播放 | 手机av网址| 国产一级片免费视频 | 手机天堂av | 免费的黄色av | 四虎www. | 中文字幕在线观看不卡 | 小明永久2015xxx免费看视频 | 日本黄色一区 | 欧美日韩大片 | 日本高清在线观看 | 人人澡人人草 |