岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

<td id="yyghu"></td>

ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 手機快報 > 正文內容

蘋果聯合中國人民大學發布 VSSFlow 模型：無聲視頻 AI 同步生成音效與配音

時間：2026-02-10 16:33:17 來源：IT之家編輯：快訊 IP：北京 發表評論無障礙通道

2 月 10 日消息，科技媒體 9to5Mac 昨日（2 月 9 日）發布博文，報道稱蘋果公司攜手中國人民大學（簡稱人大），推出 VSSFlow 新型 AI 模型，突破了傳統音頻生成技術的瓶頸，僅需單一系統即可從無聲視頻中同時生成逼真的環境音效與人類語音。

該模型的核心能力在于“化靜為動”，能夠直接處理無聲視頻數據，在單一系統的框架下，同步生成與畫面高度匹配的環境音效以及精準的語音對話。該成果不僅解決了過去音頻生成模型功能單一的問題，更在生成質量上達到了行業領先水平。

援引博文介紹，在 VSSFlow 問世之前，行業內的模型往往存在嚴重的偏科現象：視頻轉聲音模型（V2S）難以生成清晰的語音，而文本轉語音模型（TTS）又無法處理復雜的環境噪音。

傳統的解決方案通常是將兩者分階段訓練，這不僅增加了系統的復雜性，還常因任務沖突導致性能下降。VSSFlow 則另辟蹊徑，采用了 10 層架構設計并引入“流匹配”技術，讓模型自主學習如何從隨機噪聲中，重構出目標聲音信號。

研究團隊在訓練過程中發現了一個令人驚喜的現象：聯合訓練不僅沒有導致任務干擾，反而產生了“互助效應”。即語音數據的訓練提升了音效生成的質量，而音效數據的加入也優化了語音的表現。

團隊為了實現這一效果，向模型投喂了混合數據，包括配有環境音的視頻、配有字幕的說話視頻以及純文本轉語音數據，并利用合成樣本微調模型，讓其學會同時輸出背景音與人聲。

在實際運行中，VSSFlow 以每秒 10 幀的頻率從視頻中提取視覺線索來塑造環境音效，同時依據文本腳本精確引導語音生成。

02-10

蘋果前首席設計官批斯拉式全觸控交互：簡單且偷懶

02-10

OPPO Find N6將于3月發布：挑戰全球折痕最淺折疊屏

02-10

蘋果低價版MacBook 起售價有望低于iPhone 17

02-10

銷量下滑、利潤承壓，保時捷在中國被迫轉入防守

02-10

iPhone 18 Pro Max電池將更大消息稱有SIM卡也有望達到5000mAh

02-10

萬達酒店攜手支付寶升級智慧服務，長白山滑雪度假開啟無卡便捷新體驗

02-10

江汽集團項興初透露：尊界S800將推高定版，新車型已通過工信部申報

02-10

聯發科天璣芯片或牽手英特爾代工，技術挑戰下合作前景待探

02-10

新阿維塔12內飾亮點多：鴻蒙座艙、太行智控底盤，豪華旗艦再升級

02-10

極氪8X續航信息曝光：雙電池組可選，動力強勁內飾豪華即將上市

02-10

華為Pura X2或成闊大折手機“先鋒”，升級麒麟9030芯片與長焦引期待

IT之家 2 月 9 日消息，博主 @體驗more 昨晚發文透露，華為 Pura X2 預計會是首臺闊大折：7.69 英寸 WQHD+內屏、外屏升級至 5.5 英寸，方便交互。另外，該機還會升級麒麟 903…

02-10

蘋果2026年或推紅外攝像頭版AirPods Pro，帶來環境感知與手勢控制新體驗

消息稱，這款耳機將通過硬件升級實現“環境感知”功能，并可能引入空中手勢控制等創新交互方式。值得注意的是，郭明錤提到，2026年款AirPodsPro可能不會命名為“Pro 4”，而是以差異化功能（如紅外…

02-10

iQOO Z11系列入網引關注，90W快充、大屏或成新機亮點

IT之家 2 月 10 日消息，iQOO Z11 系列新機完成入網。博主 @數碼閑聊站發文稱，型號為 V2551A 的新機配備 90W快充頭，估計電池是 9000mAh 級別，搭載 1.5K LTPS 常…

02-10

紅外熱成像加持！Ulefone Armor 27T Pro+三防新機配置實用價格親民

沒錯，就是之前搞天璣 9300+ 芯片跟 1 英寸 IMX989 主攝全給你懟上的 Armor 28 Ultra 的那家名為 Ulefone三防機廠商... 乍眼一看，這外觀好像跟之前的 Armor 2…

02-10

點擊查看更多 +

全站最新

“Seedance時刻”來臨！節前，AI應用股瘋漲

A股收評：滬指漲0.13%，AI語料、影視傳媒板塊爆發

日股收盤再創歷史新高，年內累漲14.52%

韓股收漲0.07%

A股收評：三大指數小幅震蕩，AI語料、文化傳媒板塊爆發

A股異動︱欣靈電氣跌逾4% 股東張彭春擬減持不超1.28%公司股份

熱門內容

本欄最新

比亞迪獲高校老師青睞：硬核技術筑基，科教理念共鳴共繪品牌新篇

法拉利Luce純電跑車來襲：內飾精妙設計搭配超強動力性能

新阿維塔12內飾亮點多：鴻蒙座艙、方形方向盤、太行智控底盤齊上陣

問界M8領跑40萬級豪華市場：中國新豪華如何重構價值新標桿？

法拉利純電跑車Luce內飾曝光：蘋果設計大師操刀科技感拉滿

法拉利首款純電超跑Luce內飾曝光：物理按鍵回歸，打破大屏化慣例

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.