滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

哥大博士突破機器人“恐怖谷”！自監督學習讓機器人唇部“活”起來，11種語言同步無壓力

時間：2026-02-10 00:30:38 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

在人機交互領域，如何讓機器人擁有更自然的面部表情始終是科研人員關注的焦點。近期，哥倫比亞大學博士胡宇航帶領團隊在面部機器人研究上取得突破性進展，其研發的Emo面部機器人通過創新技術實現了與人類語音同步的唇部運動，相關成果登上《科學·機器人學》封面，引發學界與產業界的廣泛關注。

傳統機器人研發往往聚焦于運動能力或操作性能，但胡宇航團隊選擇了一條差異化路徑——賦予機器人情感表達能力。這項研究始于哥倫比亞大學的博士課題，經過兩年積累已在《科學》《自然》子刊發表三篇論文。團隊發現，嘴唇作為人類交流中動作最頻繁的面部器官，其運動復雜性遠超想象：不僅由多組肌肉群協同驅動，還需同步傳遞語言、情感與社交信號，對時間精度要求極高。

針對這一挑戰，研究團隊摒棄了傳統基于固定音素-視位映射的規則方法。該方法需為每個音素設計特定嘴型，但存在三大缺陷：無法適應不同語速與情緒狀態下的發音差異；多語言場景需重新設計規則，工作量巨大；硬件升級后需徹底重構動作系統。更關鍵的是，人類發音中音素與嘴型并非簡單對應，而是受語境、語速、情緒等多重因素影響，呈現高度連續的動態特征。

團隊提出的解決方案是構建數據驅動的自監督學習系統。該系統分為兩個階段：首先通過"照鏡子"訓練建立機器人自我模型——隨機生成數千種面部表情并觀察反饋，使系統掌握自身硬件的運動邊界；隨后引入人類視頻數據，學習嘴唇運動的統計規律與高層時序結構，并通過自我模型將其轉化為機器人可執行的動作。這種設計有效避免了跨形態直接模仿導致的域錯配問題，為自然唇部運動奠定了基礎。

在評估方法上，研究團隊創新性地采用合成參考視頻作為基準，通過變分自編碼器潛空間計算機器人唇部運動與參考視頻的偏差。該方法突破了傳統二維關鍵點檢測易受噪聲干擾的局限，能夠精準刻畫嘴型動態與時序結構的差異，為連續語音與多語言場景下的音頻-視覺同步誤差評估提供了客觀標準。

實驗數據顯示，該系統在11種語言中均能實現自然唇部同步，包括英語、法語、日語、中文等。這種跨語言能力源于模型對底層肌肉運動模式的學習——它捕捉的是聲音節奏與嘴唇動作間的共性規律，而非特定語言的發音規則。例如，不同語言中硬輔音（如/b/、/p/）的發音雖差異顯著，但都遵循相似的"閉合-保持-釋放"運動軌跡，系統通過學習這種本質關系實現了泛化。

盡管取得突破，研究仍面臨挑戰。硬輔音處理是當前技術瓶頸，這類發音涉及多重物理約束：嘴唇需在毫秒級時間內完成精確閉合與釋放，同時協調多個自由度運動，并應對軟體接觸、非線性阻尼等復雜因素。系統在極端場景（如極快語速、多人對話、歌唱顫音）下的表現仍有提升空間。胡宇航指出，這些局限恰恰為未來研究指明了方向——通過引入更豐富的訓練數據與優化模型架構，有望逐步擴展系統的適用邊界。

當被問及技術擴展性時，胡宇航確認團隊正將研究從唇部動作延伸至整個面部表情系統。下一步計劃是協調唇部、眼神、眉毛等面部要素，構建統一細膩的情感表達框架。這項探索不僅關乎技術突破，更觸及人機交互的本質：當機器人能用整張臉傳遞情緒時，人類與機器的關系將迎來更深層次的變革。

更多>同類資訊

iOS 26.4測試版將至：Siri漸進式改良，為AI大升級悄然鋪路

對普通用戶來說，這次測試版或許不會立刻改變日常使用體驗，但它至少說明，Siri不再只是一個被動執行命令的語音入口，而是正在向更智能、更有上下文理解能力的方向過渡。iOS 26.4 可能不會讓人驚呼“時代變了…

02-10

智慧燃氣監管平臺：以科技之力筑牢燃氣安全防線守護萬家安寧

在數字化轉型的大潮中，環球軟件智慧燃氣監管平臺以其前沿的技術架構、完善的功能體系和顯著的應用成效，為燃氣企業提供了可復制、可推廣的智能化解決方案。平臺通過整合物聯網、大數據、AI、GIS等前沿技術，實現了對…

02-10

激光“魔法”：從通信到醫療，從田間到宇宙的科技變革力量

德國科研團隊研制出一款緊湊型短脈沖激光器，其能量轉換效率高達80%，遠超當前同類產品，這一突破為開發便攜、經濟的激光設備開辟了新途徑，有望廣泛應用于醫學、分析技術與量子科學等領域。從1985年濟南鑄鍛所研制…

02-10

富得投資（FD）：科技領航全球金融交易，智能服務開啟投資新篇章

未來，富得（FD）將繼續加大科技研發投入，深耕人工智能、大數據等前沿技術的應用，持續優化交易體系與服務模式，以科技賦能金融創新，以專業守護用戶信任，為全球投資者打造更加智慧化、便捷化、安全化的全球金融交易平臺…

02-10

HPE首席AI官解密：AI與自動化融合中技術、文化與邊界的碰撞

弗萊德解釋說，Mist和他在AI領域的工作起源于他試圖說服一家大型零售商在其網絡上部署移動體驗應用程序。弗萊德形容這"就像從嬰兒手中奪糖果"，因為這些技術人員擔心失去對系統的直接控制，需要建立對AI系統的信…

02-09

TIOBE 2026年2月編程語言榜：Python仍居首，R與Perl熱度回升顯活力

02-09

時代智能攜手地平線，軟硬協同共探新能源汽車智能化新路徑

02-09

榮耀與Plaud強強聯手，MagicOS系統原生AI錄音紀要，職場辦公效率大提升

02-09

黑石領投100億美元助力Firmus，AI算力基建“軍備競賽”再升級

02-09

全球首創“飛魚-1.0”大模型亮相：AI賦能南海海氣預報，開啟端側智能新篇章

02-09

Anthropic“超級碗”廣告語“變臉” 緩和矛盾凸顯與OpenAI差異化競爭

02-09

Cardi B與人形機器人共舞出“意外插曲”，人機摔倒成科技娛樂搞笑一幕

02-09

寒假新體驗！湖北省科技館攜手特斯拉，引領青少年探索科技新世界

02-09

新質生產力引領未來：驅動產業升級拓寬發展空間鑄就發展新優勢

02-09

科技豪華雙引領！騰勢D9三連冠重塑全球高端MPV市場新格局

02-09

點擊查看更多 +

全站最新

當算力競賽退潮，萬億增量的錨點正轉向AI"深水區"

"高市行情"殺回來了？日股狂飆，日元危機四伏

公告精選︱源杰科技：擬投資約12.51億元建設光電通訊半導體芯片和器件研發生產基地二期項目

小米SU7應用2200MPa超強鋼：以行業最高強度解鎖安全與輕量化新路徑

小米YU7 GT工信部亮相！黑化設計配大尺寸寬胎，高性能SUV新選擇來了

小米汽車“無序開門”專利落地，2025年銷量飆升，2026年劍指55萬新目標

熱門內容

本欄最新

時代智能攜手地平線，軟硬協同共探新能源汽車智能化新路徑

寒假新體驗！湖北省科技館攜手特斯拉，引領青少年探索科技新世界

科技豪華雙引領！騰勢D9三連冠重塑全球高端MPV市場新格局

時代智能攜手地平線軟硬協同探索新能源汽車完整智能化新路徑

極映科技：AI重構物理仿真范式，工業創新“天花板”如何被擊穿？

2025年我國互聯網發展成果豐碩：網民超11億生成式AI用戶達6億

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

哥大博士突破機器人“恐怖谷”！自監督學習讓機器人唇部“活”起來，11種語言同步無壓力