在線視頻巨頭YouTube近日宣布,其基于人工智能技術的自動配音功能已面向全球用戶正式上線。該功能支持包括中文在內的27種主流語言互譯,其中英語、法語、德語等8種語言還特別推出"情感化語音"選項,通過調整語調、語速和重音等參數,使配音更具表現力和感染力。
針對普通觀眾,平臺會根據用戶觀看歷史自動匹配配音語言,并在播放器界面新增語言選擇按鈕。用戶既可保留視頻原聲,也可通過下拉菜單切換至目標語言,系統會實時生成對應配音。測試顯示,中文配音的準確率達到92%以上,在新聞、教育等類型內容中表現尤為突出。
內容創作者方面,系統默認開啟自動配音功能,但允許手動關閉。為提升翻譯質量,YouTube開發了智能內容識別系統,可自動過濾音樂、純音效等不適合配音的片段。正在測試的唇形同步技術通過分析視頻人物口型變化,動態調整配音時間軸,使翻譯后的語音與原始畫面口型保持同步,有效降低違和感。
目前支持的配音方向涵蓋雙向互譯:從英語可轉譯為阿拉伯語、孟加拉語、荷蘭語等20種語言;從中文則可轉譯為阿拉伯語、孟加拉語、荷蘭語等24種語言。平臺技術團隊表示,后續將持續優化方言識別和俚語翻譯功能,特別針對中文多音字和日語敬語體系進行專項訓練。
這項功能在測試階段已獲得積極反饋。某教育頻道創作者表示,自動配音使其課程覆蓋范圍從單一語言市場擴展至全球150個國家和地區,觀看量增長370%。普通用戶調研顯示,83%的受訪者認為情感化語音提升了跨語言觀看體驗,尤其在紀錄片和劇情類內容中效果顯著。











