滾動資訊

當(dāng)前位置：首頁 > 資訊 > 手機快報 > 正文內(nèi)容

蘋果攜手高校推出PCG技術(shù)：AI語音生成效率與質(zhì)量雙提升

時間：2026-02-03 19:08:55 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

蘋果公司與特拉維夫大學(xué)聯(lián)合研發(fā)的語音生成技術(shù)取得突破性進(jìn)展，雙方共同提出的“原則性粗粒度”（PCG）方法有效解決了AI文本轉(zhuǎn)語音（TTS）領(lǐng)域長期存在的速度與質(zhì)量矛盾問題。該技術(shù)通過創(chuàng)新性的驗證機制，在保持音頻自然度的前提下，將語音生成效率提升了近四成。

傳統(tǒng)TTS系統(tǒng)普遍采用自回歸模型架構(gòu)，其工作原理類似于逐字拼寫——每個語音單元的生成都嚴(yán)格依賴前序單元的精確匹配。這種機制雖能保證輸出準(zhǔn)確性，但過度嚴(yán)苛的驗證標(biāo)準(zhǔn)導(dǎo)致系統(tǒng)頻繁拒絕聽覺效果相近的可行方案。研究團(tuán)隊發(fā)現(xiàn)，不同聲學(xué)標(biāo)記產(chǎn)生的實際聽感差異往往微乎其微，現(xiàn)有技術(shù)的“單點驗證”模式存在顯著優(yōu)化空間。

PCG技術(shù)的核心創(chuàng)新在于構(gòu)建聲學(xué)相似組體系。研究人員將具有相似聽覺特征的語音單元歸類為同一組別，系統(tǒng)驗證時不再要求絕對精確匹配，而是允許預(yù)測結(jié)果落在合理范圍內(nèi)。這種“范圍驗證”機制通過雙模型協(xié)作架構(gòu)實現(xiàn)：輕量級預(yù)測模型快速生成候選單元，大型裁判模型負(fù)責(zé)審核組別歸屬。試驗表明，該架構(gòu)在保持4.09分自然度評分（滿分5分）的同時，將生成速度提高了40%。

極限測試數(shù)據(jù)進(jìn)一步驗證了技術(shù)的魯棒性。當(dāng)研究人員故意替換91.4%的語音單元為同組其他選項時，系統(tǒng)詞錯率僅上升0.007，說話人特征相似度下降0.027，這些變化均處于人類聽覺感知閾值之下。這種容錯能力源于PCG對語音本質(zhì)特征的把握——相比單個標(biāo)記的精確性，系統(tǒng)更關(guān)注整體聲學(xué)特征的連貫性。

該技術(shù)的工程化優(yōu)勢同樣顯著。作為推理階段的優(yōu)化方案，PCG可直接應(yīng)用于現(xiàn)有模型而無需重新訓(xùn)練，聲學(xué)相似組的存儲需求僅約37MB內(nèi)存。這種輕量化特性使其特別適合資源受限的邊緣計算場景，為移動設(shè)備上的實時語音合成提供了可行路徑。目前研究團(tuán)隊正探索將該技術(shù)擴(kuò)展至多語言場景，進(jìn)一步驗證其通用性。

更多>同類資訊

真我海外新機與Buds T500 Pro耳機亮相，配置亮點多引關(guān)注

據(jù)悉，這款realme 真我 Buds T500 Pro 配備了 12.4mm 動圈單元，并通過 realme Link App 支持Spatial 360（360 度空間音頻）技術(shù)；支持 50dB 的主…

02-21

榮耀Magic V6預(yù)熱徐夢桃成見證官華為新機或配8000mAh電池引期待

此前爆料OPPO新款大折疊Find N6和榮耀新一代大折疊Magic V6均將在節(jié)后登場，現(xiàn)在榮耀這邊率先開啟預(yù)熱。而關(guān)于Magic V6這臺尚未發(fā)布的新一代折疊屏旗艦，今日網(wǎng)上有更多徐夢桃在冬奧現(xiàn)場上手真…

02-21

華為尊界MPV諜照曝光！北京車展亮相，國產(chǎn)高端MPV格局或迎新變局

02-21

豐田2026款RAV4部分車型支持Apple Wallet車鑰匙需特定設(shè)備及訂閱服務(wù)

02-21

三星攜手KT突破6G關(guān)鍵技術(shù)：7GHz頻段X-MIMO驗證成功，下行速率達(dá)3Gbps

該公司與 KT 公司、是德科技合作，成功在 7GHz 頻段上驗證了極致多輸入多輸出（X-MIMO）技術(shù)。7GHz 頻段的 X-MIMO技術(shù)被視為核心 6G 技術(shù)，因為它通過更短的波長實現(xiàn)更高的天線密度來提…

02-21

macOS 26.3代碼藏玄機：入門MacBook與兩款Studio Display顯示器或即將登場

02-21

OPPO Find N6折疊屏3月17日發(fā)布！輕薄機身配2nm芯，續(xù)航影像全拉滿

除了Find N6折疊屏旗艦，OPPO還宣布，將于3月17日同步發(fā)布A6i+千元續(xù)航神機，這款機型主打長續(xù)航和高性價比，搭載大容量電池和高效處理器，價格下探至1000元以內(nèi)，滿足預(yù)算有限用戶的需求。據(jù)悉，O…

02-21

三星Galaxy Z Flip7價格直降1500元，小折疊屏標(biāo)桿之作觸手可及

在這個追求個性與極致便攜的時代，手機早已不僅僅是通訊工具，更是一種潮流配飾，當(dāng)你第一次將三星Galaxy Z Flip7握在手中，那種精致如粉餅盒般的機械質(zhì)感，會讓你瞬間明白為什么依然有那么多人對三星的折疊屏…

02-21

本田PCX160：配置雖“保守”，卻是不少通勤族的“務(wù)實摯愛”

02-21

三星攜手KT突破6G技術(shù)：7GHz頻段X-MIMO驗證成功，下行速率達(dá)3Gbps

02-21

蘋果iOS 26.4測試版調(diào)整：App Store賬戶退出功能移至設(shè)置，操作變繁瑣

02-21

華為中端新機亮點足：8000mAh±大電池搭配K8系芯片，2000元檔或成新寵

02-21

“手機致傷”，滑雪比賽為啥非得帶手機？

02-21

華為手環(huán)11上架菲律賓官網(wǎng)：1.62英寸AMOLED屏

02-21

韋布望遠(yuǎn)鏡立功：在遙遠(yuǎn)星系捕捉到早期宇宙氧元素信號

這張JADESGSz140星系的放大圖像中，背景圖由詹姆斯韋布太空望遠(yuǎn)鏡（JWST）拍攝，插圖則由阿塔卡馬大型毫米波亞毫米波陣列（ALMA）拍攝，展示了該早期星系中存在氧元素：目前這是人類已知距離第二遙遠(yuǎn)的…

02-21

點擊查看更多 +

全站最新

全新國產(chǎn)寶馬3系諜照來襲新世代設(shè)計語言賦能 2026年或?qū)⒌菆?/a>

設(shè)施升級充電快、智慧運維保障穩(wěn)、溫情服務(wù)暖人心——春運新能源車充電無憂

油車露營續(xù)航無憂更安心，電車外放電便利但電量焦慮待解

油車與電車長期停放電量差異大解析：原因、影響及應(yīng)對策略全知道

廣西春節(jié)新能源汽車充電量創(chuàng)新高充電保障升級助力綠色出行

車輛久放怕虧電？老司機親授兩招，輕松護(hù)電瓶多用好幾年

熱門內(nèi)容

本欄最新

豐田2026款RAV4部分車型支持Apple Wallet車鑰匙需特定設(shè)備及訂閱服務(wù)

本田PCX160：配置雖“保守”，卻是不少通勤族的“務(wù)實摯愛”

問界M6內(nèi)飾實拍圖流出取消傳統(tǒng)儀表盤搭載AR-HUD 2026年或25萬起售

問界M6內(nèi)飾實拍：取消傳統(tǒng)儀表盤搭載AR-HUD 2026年二季度或25萬起售

2026加拿大國際車展經(jīng)典老爺車齊聚多倫多觀眾沉浸式感受汽車魅力

美國新勢力Rivian發(fā)布三款純電新車，美式簡約風(fēng)設(shè)計，性能續(xù)航亮點多

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

蘋果攜手高校推出PCG技術(shù)：AI語音生成效率與質(zhì)量雙提升