岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

蘋果公布PCG技術:質量零妥協、AI語音生成提速40%

   時間:2026-02-03 11:40:42 來源:IT之家編輯:快訊 IP:北京 發表評論無障礙通道
 

2 月 3 日消息,科技媒體 9to5Mac 今天(2 月 3 日)發布博文,報道稱蘋果公司攜手特拉維夫大學,聯合發表論文,提出名為“原則性粗粒度”(PCG)的語音生成新方法,從而解決 AI 文本轉語音(TTS)技術的速度瓶頸。

援引博文介紹,在生成語音方面,目前行業主流采用“自回歸模型”,采用“逐個預測”的方式,即基于已有的 tokens 來預測下一個。

然而,這種機制要求預測結果必須“精確匹配”預設的 tokens,導致模型經常拒絕實際上聽感差異極小、完全可用的預測結果。這種過于嚴苛的驗證標準,直接拖慢了整體的生成速度。

研究團隊為了解決上述問題,提出了“原則性粗粒度”(Principled Coarse-Graining,簡稱 PCG)技術。該技術的核心邏輯在于“求同存異”:研究人員認為,不同的聲學 token 往往能產生幾乎相同的聽覺效果。

因此,PCG 不再將每個聲音視為完全獨立的個體,而是建立了“聲學相似組”。只要模型生成的預測 token 落在正確的“相似組”范圍內,系統就會予以采納。這種靈活的驗證機制,本質上是將嚴苛的“單點驗證”升級為了容錯率更高的“范圍驗證”。

在具體運行中,PCG 引入了“投機解碼”策略,構建了一套雙模型協作架構。首先,由一個輕量級的小模型快速“猜測”并提出候選語音 token;隨后,由一個參數更大的“裁判模型”進行審核。

只要候選 token 屬于正確的聲學組,大模型便會“放行”。這種分工不僅保留了小模型的高速度,也利用大模型保障了輸出質量,有效平衡了效率與準確性。

試驗數據顯示,應用 PCG 技術后,語音生成速度提升了約 40%,且并未犧牲音頻質量。在自然度評分(滿分 5 分)中,該模型取得了 4.09 的高分。

在一項極限壓力測試中,研究人員將 91.4% 的語音 token 替換為同組的其他 token,結果顯示詞錯率僅增加了 0.007,說話人相似度僅下降 0.027,人耳幾乎無法察覺差異。

PCG 屬于“推理階段”的優化方案,意味著無需對現有模型進行耗時耗力的重新訓練即可直接應用。存儲聲學相似組僅需約 37MB 的額外內存。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 天天躁日日躁狠狠躁 | 久久综合图片 | 久久精品亚洲精品 | 日韩精品一卡二卡 | 亚洲h视频在线观看 | 国产精品视频成人 | 国产主播av | 欧美日韩一级在线 | 亚洲大胆视频 | 日本精品视频 | 亚洲制服丝袜av | www.成人在线 | 五月天婷婷综合 | 中国成人毛片 | 中文字幕亚洲精品 | 国产精品99久久久 | 日韩黄色小视频 | 黄色在线免费看 | 男人懂得网站 | 国产一区二区免费在线观看 | 黄色成人在线视频 | 久久99久久99精品免视看婷婷 | 999久久| 日本黄色免费网站 | 毛片在线看片 | 亚洲综合精品 | xxxx性欧美 | 综合色影院 | 国产精品欧美一区二区三区 | 永久免费看mv网站入口 | 日韩欧美亚洲精品 | 亚洲啊啊啊啊啊 | 日日干日日插 | 97色资源 | 午夜影视在线观看 | 久久精品第一页 | 特级黄色网 | 在线播放中文字幕 | 午夜视频一区二区 | 日本久久99 | 国产激情在线观看 |