岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

小米重磅開源!OmniVoice 覆蓋 600+ 語種零樣本語音克隆 TTS:WER 僅 0.84%、速度快 40 倍,小語種也能輕松復活

   時間:2026-04-09 18:44:21 來源:CHINAZ編輯:快訊 IP:北京 發表評論無障礙通道
 

近日,小米下一代 Kaldi 團隊(k2-fsa)正式開源 OmniVoice,這是一款支持超過600種語言的超大規模多語言零樣本文本轉語音(TTS)模型,在中英文及多語言基準測試中多項關鍵指標達到 SOTA(State-of-the-Art),為語音合成領域帶來全新突破。

性能指標領先:中文 WER 低至0.84%,多語言超越主流商用模型

在 Seed-TTS 中文測試集上,OmniVoice 的詞錯誤率(WER)僅為0.84%。在多語言 benchmark 上,其相似度(SIM-o)和 WER 指標均超過 ElevenLabs v2和 MiniMax 等知名模型,展現出卓越的語音自然度和清晰度。

極速推理:RTF 低至0.025,合成速度比實時快40倍

OmniVoice 的實時因子(RTF)低至0.025,意味著合成速度遠超實時需求,效率提升顯著。這使得模型在實際應用中能夠快速生成長文本語音,極大提升用戶體驗。

核心架構創新:擴散語言模型風格的離散非自回歸設計

OmniVoice 采用擴散語言模型風格的離散非自回歸架構,可直接從文本一步生成語音,跳過傳統的中間語義 token 階段。這一設計顯著簡化了流程,同時保證了語音質量。全碼本隨機掩碼策略結合預訓練 LLM 初始化,進一步提升了訓練效率和最終輸出的清晰度與可懂度。

靈活語音克隆與定制:3-10秒參考音頻即可實現

模型支持使用3-10秒的短參考音頻進行高品質零樣本語音克隆。用戶還可以通過自然語言描述自定義聲音屬性,包括性別、年齡、音調、口音、方言等,甚至可以生成耳語風格等特殊效果。

支持非語言符號與精細發音控制

OmniVoice 能夠處理非語言符號,例如[laughter]表示笑聲,還支持通過拼音或音標進行發音糾正,特別適合中文及方言的精準合成。

600+ 語種覆蓋:助力小語種與瀕危語言數字化保護

OmniVoice 的最大亮點在于其廣泛的語言覆蓋范圍,從主流語種到眾多低資源語言均能高效支持。對于小語種和瀕危語言而言,只需少量樣本即可生成高質量語音,這對語言文化的數字化保存和保護具有重要意義。

OmniVoice 的代碼和預訓練模型已在 GitHub 和 Hugging Face 上開源,開發者可輕松本地部署或集成應用。AIbase 將持續關注 OmniVoice 的社區反饋與實際使用案例,歡迎開發者分享更多體驗。

項目地址:https://github.com/k2-fsa/OmniVoice

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 亚洲精品亚洲人成人网 | 久久三 | 天天操国产 | 亚洲骚图| 四虎影视在线观看 | 国产精品视频久久久久 | 亚洲男人的天堂在线 | 国产一区在线观看免费 | 99视频导航 | 亚洲国产精品99 | 欧美撸撸 | 国产高潮流白浆 | 欧美爱爱视频 | 逼逼爱插插网站 | 午夜精品影视 | 中文字幕二 | 日韩av手机在线免费观看 | 天天操天天操天天操天天操 | 亚洲色诱 | 日韩v片 | 成人综合在线观看 | 欧美成人精品一区二区三区 | 久久久观看 | 久久综合伊人77777蜜臀 | 免费看的黄色网 | 天堂国产在线 | 日女人逼视频 | 黄色av免费 | 免费污片网站 | 国产又爽又黄又嫩又猛又粗 | 韩国精品av | 亚洲一区二区视频在线观看 | 天美传媒免费在线观看 | 天天操狠狠操 | 岛国大片在线观看 | 日韩午夜在线观看 | 成人黄色在线 | 日韩久久久久久久 | 手机av不卡 | 国产成人精品一区二三区 | 日韩欧美一区二区三区四区 |