滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

清華團隊突破強化學習困境：RACS算法實現安全與性能雙贏 14項任務登頂SOTA

時間：2026-02-16 23:51:33 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

在自動駕駛與機器人控制等高風險領域，強化學習技術正面臨關鍵挑戰：如何在保證絕對安全的前提下實現高效控制。清華大學研究團隊近期提出創新算法，通過引入"主動探索危險邊界"機制，成功破解了安全強化學習領域長期存在的核心矛盾，在權威測試平臺刷新多項性能紀錄。

傳統安全強化學習算法普遍采用"被動防御"策略，通過嚴格限制智能體行動范圍來避免違規。但研究團隊發現，這種過度保守的設計反而導致系統陷入惡性循環——隨著安全約束加強，違規樣本數量急劇減少，使得系統對危險邊界的認知變得模糊。實驗數據顯示，當違規率降至0.1%以下時，可行性函數的估計誤差會呈指數級增長，最終引發安全性崩塌。

針對這一困境，研究團隊開發出雙策略架構的RACS算法。該系統包含兩個協同工作的智能體："執行者"負責在安全范圍內優化任務表現，"探險者"則專門觸碰安全邊界以收集關鍵數據。這種設計巧妙利用對抗性探索機制，在保持總采樣量不變的情況下，使違規樣本占比提升10-100倍，顯著改善了系統對危險狀態的判斷精度。

技術實現層面，研究團隊采用重要性采樣技術解決雙策略數據分布差異問題，并通過KL散度約束確保訓練穩定性。在Safety-Gymnasium基準測試中，該算法在14項復雜任務中同時實現安全指標與任務性能的雙重領先。特別是在高維度HumanoidVelocity任務中，RACS不僅達成零違規，其任務回報率較傳統方法提升23%，推箱子導航任務的成功率更是提高41%。

深入分析顯示，算法性能提升源于三個關鍵改進：危險狀態采樣量增加一個數量級、可行性函數估計誤差降低82%、風險低估頻率減少94%。這意味著系統能更準確識別潛在危險，從根本上避免了因認知模糊導致的意外違規。在HalfCheetahVelocity等任務中，該算法甚至實現了連續百萬步零違規的突破性表現。

這項研究為安全強化學習的實際應用開辟了新路徑。通過將"主動認知危險"理念融入算法設計，有效解決了高風險場景中安全與性能的平衡難題。相關代碼已在開源平臺公開，其雙策略架構與對抗性探索機制為工業界提供了可直接借鑒的技術方案，特別是在自動駕駛決策系統開發中具有重要應用價值。

更多>同類資訊

馬年春晚機器人成焦點！多款機器人炫技，科技與藝術共舞引熱議

02-16

宇樹科技機器人春晚秀絕技！高動態集群控制技術首次驚艷亮相

02-16

春晚“機器人蔡明”引熱議松延動力：為適配小臉設計尺寸縮減三成

02-16

14年跨越！從2012到2026，看中國機器人在春晚舞臺的進化之路

02-16

AMD攜手塔塔咨詢服務，在印度部署“Helios”AI系統共筑AI新基建

02-16

2026馬年春晚：魔法原子上百臺機器熊貓首秀開啟多機協同表演新篇章

02-16

春晚舞臺上的科技奇跡：“假蔡明”復刻、機器人舞蹈與300個算法策略揭秘

02-16

春晚宜賓分會場百臺熊貓機器人驚艷亮相魔法原子創始人：盼攜其走向世界

02-16

1納米“電場探針”問世！低功耗芯片或讓電子設備告別頻繁充電

“簡單說，它用一個極其巧妙的設計，打破了傳統芯片的一大難題：電腦和手機處理器（CPU）在處理數據時，存儲和計算是分開的，數據在兩個模塊之間來回搬運，不僅費時，也很費電。邱晨光舉例：“就像用一根極細的針把力…

02-16

蔡明春晚再遇“機器人伙伴”，松延動力攜多款機器人共慶新春

IT之家 2 月 16 日消息，2026 年總臺春晚期間，松延動力多款機器人登上小品《奶奶的最愛》現場，通過笑話互動與現場演員表演小品，還表演了翻跟頭、頭部伸長等技能。小品講述單身男子訂購機器人妻子后引發的一…

02-16

蔡明春晚再遇“機器人伙伴”，松延動力攜多款機器人亮相2026年總臺春晚

02-16

宇樹機器人三登春晚舞臺！2026年《武BOT》節目武術跑酷齊上陣

02-16

2026春晚四川宜賓分會場：魔法原子與宇樹科技機器人同臺獻藝

02-16

宇樹科技機器人春晚秀絕技，集群控制技術首秀引領行業新潮流

02-16

AMD攜手塔塔咨詢服務在印部署“Helios”AI系統共繪AI數據中心新藍圖

02-16

點擊查看更多 +

全站最新

光影流轉科技賦能！重慶造賽力斯問界M9再登春晚演繹“手到福來”

全新雷克薩斯ES實車亮相引熱議：顛覆設計，是創新還是“失味”？

2027款路虎攬勝中期改款諜照來襲或配發光LOGO內飾有新變化

智界V9或3月登場，豪華配置引期待，37.99萬起售能否攪動高端MPV市場？

大眾探歌T-Roc R高性能版諜照流出，性能升級或成歐洲SUV市場新焦點

問界M9數控燈陣閃耀春晚舞臺重慶“智造”演繹科技年味新篇章

熱門內容

本欄最新

長安汽車牽手巴渝非遺：科技與文化共舞跨界營銷繪就雙向共贏新畫卷

鴻蒙智行問界M9再登央視春晚，三次亮相見證科技與舞臺的精彩融合

春節自駕返鄉潮涌，長三角如何“智解”新能源充電難題？

廣汽馮興亞談行業挑戰：身處“四期疊加”關口，堅定變革謀發展

春運“科技范兒”十足：充電新招、交通調度、文旅融合齊上陣

客易云劇本改寫牽手數字人：AI賦能創作，開啟內容產業新想象

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

清華團隊突破強化學習困境：RACS算法實現安全與性能雙贏 14項任務登頂SOTA