滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

蘋果與人大攜手：VSSFlow模型突破傳統，無聲視頻秒變有聲精彩大片

時間：2026-02-10 09:06:17 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

蘋果公司近日宣布，與中國人民大學聯合研發的VSSFlow新型人工智能模型取得重大突破。這一創新成果成功打破傳統音頻生成技術的局限，通過單一系統即可從無聲視頻中同步生成逼真的環境音效與自然人聲，為多媒體內容創作開辟全新路徑。

傳統音頻生成領域長期存在功能割裂的困境：視頻轉語音模型（V2S）難以處理復雜語音細節，文本轉語音模型（TTS）則無法捕捉環境聲場特征。行業普遍采用的"分階段訓練"方案不僅增加系統復雜度，更因任務沖突導致性能衰減。VSSFlow通過10層架構設計與"流匹配"技術的創新融合，首次實現從隨機噪聲到目標聲音信號的端到端重構。

研發團隊在訓練過程中意外發現聯合訓練的協同效應。實驗數據顯示，當同時輸入環境音視頻、字幕對話視頻及純文本語音數據時，模型展現出跨模態學習能力——語音訓練數據顯著提升環境音效的真實度，而環境聲場信息則優化了語音的韻律表現。這種"數據互助"機制使模型在復雜場景下的表現尤為突出。

在實際應用中，VSSFlow采用雙軌處理機制：以每秒10幀的速率提取視覺特征生成環境音效，同時通過文本腳本精準控制語音生成。這種設計使系統能夠同步處理動態場景中的多重聲源，無論是雨滴敲擊窗欞的細微聲響，還是多人對話的復雜聲場，均可實現像素級的聲音還原。

基準測試表明，VSSFlow在語音清晰度、環境真實度、多聲源分離等核心指標上全面超越專項模型。其生成的音頻樣本在盲測中被專業人士誤認為真實錄音的比例達到87%，較傳統方案提升42個百分點。目前研發團隊已將核心代碼開源至GitHub，并計劃陸續公開預訓練模型權重及在線演示平臺。

這項突破不僅為影視后期制作、游戲開發等領域提供高效工具，更可能重塑虛擬現實、智能助手的交互范式。隨著模型持續優化，未來用戶或可通過簡單視頻輸入，即可獲得包含完整聲效的沉浸式內容，大幅降低多媒體創作的技術門檻。

更多>同類資訊

全球首個人形機器人格斗聯賽官宣 16強角逐千萬純金腰帶

現場介紹，此次賽事以眾擎機器人的人形機器人為標準競技載體，進行開源開放、安全非暴力的賽事。據了解，眾擎旗下的T800人形機器人于2025年12月發布，定價18萬元起。值得一提的是，在2025科技風云榜年…

02-10

996在美國硅谷蔓延科學家警告：人真的會被拖垮

02-10

“不要對AI說謝謝”瘋傳實測多個大模型：放心大膽用

02-10

上海影院新探索：AI機器人“入職”，多元業態融合開啟觀影新體驗

02-10

蘋果系統更新路線曝光：iOS 26.4本月測試在即，iOS 27將深耕AI與系統優化

預計 iOS 26.4 版本將首次在真實系統中展示部分在 WWDC 2024 上承諾的個性化 Siri 功能以及其他一些改進。蘋果 AI相關能力已經被期待了很長時間，而從目前的信息來看，iOS 26.4 …

02-10

6G技術初露鋒芒：引領萬物智聯新潮流，開啟未來通信新篇章

太赫茲頻段的開辟猶如挖掘出了一條“信息高速公路”，能夠滿足未來全息通信、元宇宙等超高帶寬需求；而通感一體化技術則讓基站不僅能發信號，還能像雷達一樣“感知”周圍物體的位置和動作，為自動駕駛、健康監測等場景提供更…

02-10

極星廣告嘲諷特斯拉：買電動車是選擇什么征服火星嗎

02-10

亞信科技與格思航天攜手：星載First Call成功打通，共繪低軌衛星互聯網新藍圖

02-10

SGS認證加持地平線機器人“智駕安全基座”達國際功能安全標準

02-10

時代智能攜手地平線軟硬協同共探新能源汽車智能化新路徑

02-10

同濟苑克花：以熱愛為帆，在科研無人區破浪前行的耀眼征程

02-10

樂聚機器人攜手上海機器人產業技術研究院共促人形機器人產業升級發展

02-10

蒙特利爾團隊突破：動態語音編碼，標記銳減語音依舊清晰流暢

02-10

浙大與螞蟻集團聯合創新：InftyThink+破解AI推理"長篇困境"難題

02-10

南京大學團隊突破AI視頻生成難題：路徑校正技術讓長視頻穩定連貫

02-10

點擊查看更多 +

全站最新

春節歸家路迢迢，易至EV3 PLUS以安全舒適伴您暢行每一程

小米車主頻遭惡意攻擊，車企護權引深思，汽車領域偏見之風何時止？

從《Her》到現實：前百川智能聯創焦可創業，用AI音頻造主播開啟新賽道

2026春節檔9部影片來襲！豪華陣容多樣題材，預售開啟誰將成票房黑馬？

科創板AI基金表現亮眼：國產AI芯片崛起，應用領域投資潛力持續釋放

極氪主動召回3.83萬輛車：以技術護航安全，用責任詮釋擔當

熱門內容

本欄最新

時代智能攜手地平線，軟硬協同共探新能源汽車智能化新路徑

寒假新體驗！湖北省科技館攜手特斯拉，引領青少年探索科技新世界

科技豪華雙引領！騰勢D9三連冠重塑全球高端MPV市場新格局

時代智能攜手地平線軟硬協同探索新能源汽車完整智能化新路徑

極映科技：AI重構物理仿真范式，工業創新“天花板”如何被擊穿？

2025年我國互聯網發展成果豐碩：網民超11億生成式AI用戶達6億

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

蘋果與人大攜手：VSSFlow模型突破傳統，無聲視頻秒變有聲精彩大片