滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

浙大新成果：WorldMind框架助力AI從“物理幻覺”到“現(xiàn)實(shí)高手”

時間：2026-01-28 04:46:18 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

人工智能在邏輯推理領(lǐng)域展現(xiàn)出的能力常令人驚嘆，但當(dāng)它們嘗試將理論轉(zhuǎn)化為實(shí)際動作時，卻常常暴露出令人啼笑皆非的缺陷。浙江大學(xué)與加州大學(xué)洛杉磯分校聯(lián)合團(tuán)隊(duì)在最新研究中指出，當(dāng)前主流AI模型雖能精準(zhǔn)規(guī)劃復(fù)雜任務(wù)流程，卻在執(zhí)行階段頻繁出現(xiàn)"手握物品仍試圖抓取"或"未持工具便開始操作"等違背物理常識的錯誤。這種語義理解與物理現(xiàn)實(shí)脫節(jié)的現(xiàn)象，被研究團(tuán)隊(duì)定義為"認(rèn)知-操作斷層"。

實(shí)驗(yàn)數(shù)據(jù)顯示，在模擬烹飪場景中，配備GPT-3.5-turbo的AI系統(tǒng)能完整規(guī)劃從備料到裝盤的27個步驟，但在實(shí)際執(zhí)行時，63%的操作因忽視物理約束而失敗。例如系統(tǒng)會指令"用右手持鍋鏟翻炒"，卻未檢測到虛擬手臂已被其他廚具占用。這種矛盾在需要空間推理的任務(wù)中尤為突出，研究負(fù)責(zé)人指出："當(dāng)前AI就像背誦了整本菜譜卻從未進(jìn)過廚房的學(xué)徒。"

針對這一難題，研究團(tuán)隊(duì)提出"WorldMind"雙軌學(xué)習(xí)框架，其設(shè)計(jì)靈感源自人類認(rèn)知機(jī)制中的預(yù)測-修正循環(huán)。該系統(tǒng)通過構(gòu)建動態(tài)知識庫，將每次執(zhí)行失敗轉(zhuǎn)化為物理規(guī)則更新。當(dāng)AI試圖用滿載的手抓取新物體時，系統(tǒng)不僅記錄當(dāng)前錯誤，更會推導(dǎo)出"物體抓取前需確認(rèn)手部空閑"的通用規(guī)則。這種基于錯誤反推的機(jī)制，使AI在虛擬環(huán)境中經(jīng)過3000次訓(xùn)練后，物理規(guī)則庫自動擴(kuò)展至12萬條有效約束。

在EB-Habitat家居環(huán)境測試中，采用新框架的AI任務(wù)完成率從43.6%提升至48.8%，無效操作次數(shù)減少36%。更突破性的是，其積累的經(jīng)驗(yàn)庫展現(xiàn)出跨模型兼容性——用GPT-4訓(xùn)練的物理規(guī)則，可直接優(yōu)化Llama3的任務(wù)執(zhí)行效率。這種知識遷移能力源于研究團(tuán)隊(duì)設(shè)計(jì)的自然語言編碼系統(tǒng)，所有物理規(guī)則均以結(jié)構(gòu)化語句存儲，如"開啟柜門前需后退0.5米避免碰撞"。

網(wǎng)頁操作測試進(jìn)一步驗(yàn)證了框架的普適性。在需要同時處理虛擬界面與物理環(huán)境的復(fù)雜任務(wù)中，AI的完成率從17.02%躍升至39.99%。盡管探索時間有所增加，但錯誤類型從"根本性操作錯誤"轉(zhuǎn)變?yōu)?策略性優(yōu)化空間"，這表明系統(tǒng)正從避免失敗轉(zhuǎn)向追求效率。研究日志顯示，某AI代理在第三次嘗試時，自主推導(dǎo)出"先關(guān)閉當(dāng)前標(biāo)簽頁再打開新鏈接"的瀏覽器操作最優(yōu)路徑。

該成果對AI發(fā)展路徑產(chǎn)生深遠(yuǎn)影響。傳統(tǒng)訓(xùn)練方式試圖將所有知識編碼進(jìn)模型參數(shù)，而WorldMind框架開創(chuàng)了"外部經(jīng)驗(yàn)庫"新范式。這種設(shè)計(jì)不僅降低模型訓(xùn)練成本，更使AI具備持續(xù)進(jìn)化能力——就像人類通過日記整理經(jīng)驗(yàn)，AI的知識庫可隨任務(wù)積累不斷擴(kuò)充。在醫(yī)療機(jī)器人訓(xùn)練中，這種特性使系統(tǒng)能快速吸收不同手術(shù)場景的物理約束，避免重復(fù)犯錯。

盡管取得突破，研究團(tuán)隊(duì)坦言當(dāng)前系統(tǒng)仍存在感知層局限。在物體識別錯誤率高于5%的場景中，物理規(guī)則庫的修正效果會顯著下降。多智能體協(xié)同環(huán)境下的知識沖突解決機(jī)制，尚需進(jìn)一步優(yōu)化。不過，這項(xiàng)研究已為通用人工智能發(fā)展提供新思路：通過構(gòu)建可解釋的經(jīng)驗(yàn)傳承網(wǎng)絡(luò)，或許能加速創(chuàng)造出真正理解物理世界的數(shù)字智能體。

Q&A

問：WorldMind框架如何解決AI的物理操作錯誤？

答：該框架通過雙軌學(xué)習(xí)機(jī)制，在執(zhí)行失敗時自動生成物理約束規(guī)則，在任務(wù)成功時提取可復(fù)用策略。例如當(dāng)AI因手部占用無法抓取時，系統(tǒng)會記錄"操作前需檢測肢體狀態(tài)"的規(guī)則，同時分析成功案例中的空間路徑規(guī)劃方法。

問：什么是AI的"認(rèn)知-操作斷層"現(xiàn)象？

答：指AI系統(tǒng)能生成邏輯自洽的任務(wù)計(jì)劃，但執(zhí)行時忽視物理世界的基本約束條件。典型表現(xiàn)包括空間位置判斷錯誤、工具使用條件缺失、多物體交互沖突等，根源在于語義推理與物理引擎的解耦設(shè)計(jì)。

問：不同AI模型如何共享WorldMind經(jīng)驗(yàn)庫？

答：經(jīng)驗(yàn)庫采用自然語言結(jié)構(gòu)化編碼，所有規(guī)則以"條件-動作-約束"的三元組形式存儲。這種通用表示方式使GPT系列、Llama等不同架構(gòu)的模型，都能通過解析規(guī)則語句實(shí)現(xiàn)經(jīng)驗(yàn)遷移，就像不同語言使用者通過字典進(jìn)行基本交流。

01-28

馬年春晚機(jī)器人“扎堆”登場，優(yōu)必選、宇樹、銀河通用誰能引領(lǐng)新潮流？

01-28

2025端側(cè)AI芯片：市值分化顯格局，技術(shù)場景資本共繪產(chǎn)業(yè)新圖景

01-28

NewmindAI雙路徑創(chuàng)新：讓AI深度掌握土耳其法律語言精髓

01-28

蘇州大學(xué)創(chuàng)新研究：AI“評判官”能否精準(zhǔn)評估記憶管理？新基準(zhǔn)揭曉答案

01-28

土耳其團(tuán)隊(duì)突破AI語言理解瓶頸構(gòu)建1500萬詞匯精準(zhǔn)同義詞網(wǎng)絡(luò)

01-28

曦望啟望S3推理GPU亮相：聚焦單位Token成本，國產(chǎn)GPU開啟新征程

01-28

上海科技館煥新升級！十大展區(qū)亮相，春節(jié)試開放共赴科技盛宴

01-28

聚焦AI戰(zhàn)略轉(zhuǎn)型，圖片社交平臺Pinterest宣布裁員15%以優(yōu)化資源配置

01-28

破除AI幻覺困局：以技術(shù)迭代之筆，繪就精準(zhǔn)可靠服務(wù)新畫卷

01-28

AIGC智能體全解析：從本質(zhì)到構(gòu)建，解鎖人工智能自主決策新路徑

《AIGC專題：AIGC智能體(本質(zhì)、結(jié)構(gòu)以及如何構(gòu)建)》指出，智能體是能通過傳感器感知環(huán)境、經(jīng)決策后通過執(zhí)行器作用于環(huán)境的自主實(shí)體，LLM為其提供核心“大腦”，是通往AGI的關(guān)鍵路徑，與AIGC在內(nèi)容生成…

01-28

新疆保華潤天航空解讀：無人駕駛車輛與無人機(jī)技術(shù)差異、應(yīng)用挑戰(zhàn)及未來趨勢

兩者雖然同屬無人系統(tǒng)，但在技術(shù)路徑、應(yīng)用場景及系統(tǒng)演進(jìn)方面呈現(xiàn)出不同的特點(diǎn)與挑戰(zhàn)。從系統(tǒng)架構(gòu)演進(jìn)來看，無人駕駛車輛正從封閉測試場景逐步走向開放道路，其控制系統(tǒng)呈現(xiàn)出集中與分布式結(jié)合的趨勢，并強(qiáng)調(diào)車路協(xié)同與云…

01-28

上海發(fā)布全球最大“視觸覺”數(shù)據(jù)集助力機(jī)器人突破感知瓶頸邁向精細(xì)操作

此次發(fā)布的白虎-VTouch數(shù)據(jù)集，由國家地方共建人形機(jī)器人創(chuàng)新中心（下稱“國地中心”）聯(lián)合上海緯鈦科技有限公司共同發(fā)布，核心目的就是要補(bǔ)齊具身智能缺失的“觸覺與接觸”數(shù)據(jù)拼圖，為構(gòu)建真正具備物理理解與精細(xì)…

01-28

《上海智能機(jī)器人百大場景案例集：前沿技術(shù)賦能多領(lǐng)域發(fā)展新圖景》

今天分享的是：報(bào)告共計(jì)：398頁《上海智能機(jī)器人百大場景案例集》由上海人工智能研究院編制、上海市經(jīng)濟(jì)和信息化委員會指導(dǎo)，于2025年9月發(fā)布，聚焦上海智能機(jī)器人標(biāo)桿企業(yè)的創(chuàng)新示范應(yīng)用，遴選百個具有示范性、…

01-28

致景科技憑AI賦能紡織數(shù)智化轉(zhuǎn)型榮登2025中國獨(dú)角獸TOP100榜單

致景科技憑借AI技術(shù)助力紡織服裝全產(chǎn)業(yè)鏈數(shù)智化轉(zhuǎn)型的創(chuàng)新實(shí)踐與實(shí)際成效，入選2025年度中國獨(dú)角獸TOP100榜單。致景科技憑借AI技術(shù)助力紡織服裝全產(chǎn)業(yè)鏈數(shù)智化轉(zhuǎn)型的創(chuàng)新實(shí)踐與實(shí)際成效，入選2025年度中國…

01-28

點(diǎn)擊查看更多 +

全站最新

邁越科技李常青：十二載攜手華為，從合作到共創(chuàng)共赴智能新征程

春晚舞臺上的科技狂歡：魔法原子如何讓機(jī)器人“破圈”又“落地”？

螞蟻靈波科技開源LingBot-Depth模型，為機(jī)器人三維視覺帶來新突破

全家攜手飛書構(gòu)建數(shù)字新基建，以數(shù)智協(xié)同賦能零售行業(yè)高效發(fā)展

小米YU7斬獲2025微博年度純電車型殊榮，雷軍致謝并分享亮眼交付成績

卡車也會"智慧運(yùn)算"？中國重汽智能輔助駕駛，給出干線物流增效最優(yōu)解

熱門內(nèi)容

本欄最新

螞蟻靈波科技開源LingBot-Depth模型，為機(jī)器人三維視覺帶來新突破

長城2026新車規(guī)劃亮點(diǎn)多：坦克800國產(chǎn)，歸元平臺首車，還有V8超跑來襲

特斯拉奧斯汀開放無安全員Robotaxi服務(wù)，乘客38次叫車未果運(yùn)營規(guī)模待擴(kuò)大

跨境電商新引擎：Hilight一鍵生成商用視頻，AI驅(qū)動營銷變革新篇章

從“人找樁”到“樁找車”，嵐圖汽車智慧超充站破百引領(lǐng)補(bǔ)能新變革

精智實(shí)業(yè)赴港上市：2025年前9月營收4.18億多元業(yè)務(wù)布局顯成效

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

浙大新成果：WorldMind框架助力AI從“物理幻覺”到“現(xiàn)實(shí)高手”