岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

告別“聲畫兩張皮”:通義實驗室發布 PrismAudio,讓 AI 聽懂視頻再配音

   時間:2026-03-25 04:11:10 來源:CHINAZ編輯:快訊 IP:北京 發表評論無障礙通道
 

在 AI 視頻生成大火的當下,“有畫無聲”或“聲不對位”一直是影響沉浸感的最后一道屏障。針對這一痛點,阿里通義實驗室近期推出了全新的視頻生成音頻(Video-to-Audio)框架——PrismAudio。該研究已被頂級 AI 會議 ICLR2026收錄,核心旨在為視頻自動配上嚴絲合縫的環境音效。

先思考再發聲:引入“思維鏈”的配音大師

傳統的配音模型通常是“直覺式”生成,容易出現馬蹄落在地上卻發出鳥叫,或者聲音比畫面慢半拍的尷尬情況。PrismAudio 的突破在于它學會了“先寫筆記,再發聲”。

分解式思維鏈: 模型在生成聲音前,會先分析視頻內容:畫面里有什么?聲音何時開始?音質是清脆還是低沉?聲源在左還是在右?

四重老師打分: 為了確保質量,研發團隊引入了強化學習,由四位“虛擬老師”從語義一致性、時序同步性、美學質量和空間準確性四個維度同時打分。這種多維度的反饋機制,解決了以往模型“顧此失彼”的頑疾。

輕量且高效:9秒視頻配音僅需0.6秒

除了聽得準,PrismAudio 還跑得極快。得益于自研的 Fast-GRPO 高效訓練算法,該模型在性能跨越式提升的同時,保持了極高的運行效率:

小身材大能量: 模型參數僅為5.18億,遠低于動輒數十億參數的同類模型。

極速響應: 生成一段9秒的高質量音頻僅需 0.63秒,幾乎做到了“即傳即得”。

行業觀察:環境音效的“真”時代

PrismAudio 的出現,不僅為影視后期、短視頻創作提供了強大的自動化工具,也為多目標生成任務提供了新的思路。當 AI 能夠精準權衡聲音的質感與空間感,未來的視頻創作將真正實現“所見即所聞”。

論文地址:arXiv:2511.18833

開源地址:https://prismaudio-project.github.io/

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 午夜网站在线观看 | 亚洲永久在线观看 | 日本国产在线 | 亚洲国产精品va在线看黑人 | 奇米影视狠狠干 | 久久综合桃花网 | 成人精品一二三区 | 国产青青青 | 成人激情社区 | 精品美女在线视频 | 四虎成人精品 | 亚洲天堂成人在线观看 | 视频一区二区中文字幕 | 777久久久 | 欧美三级视频在线播放 | 99热在线只有精品 | 午夜看片福利 | 九九久久九九久久 | 九九精品网 | 成人黄页 | 亚洲精品第一 | 三级网站在线 | 福利资源在线观看 | 狠狠干超碰 | 在线观看欧美日韩 | 久操久热 | 伊人称影院| 婷婷久草 | 国产精品视频在线免费观看 | 五月婷婷国产 | h视频在线观看网站 | 中文在线字幕观看 | 国产精品网站视频 | 四虎8848精品成人免费网站 | 欧洲av网站| 秋霞成人午夜鲁丝一区二区三区 | 日日操夜夜爽 | 日韩资源| 黄色大片网址 | 免费在线观看一区二区三区 | 亚洲一区二区三区四区视频 |