滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

高德發布ABot具身操作和具身導航基座模型

時間：2026-02-12 21:53:45 來源：TechWeb編輯：快訊 IP：北京 發表評論無障礙通道

2月12日消息，近日，阿里巴巴集團旗下高德正式發布具身操作基座模型ABot-M0與具身導航基座模型ABot-N0，補齊了具身機器人規模化落地的兩塊核心能力——操作的通用性和導航的長程性，并刷新了全球多項權威評測紀錄。

ABot-M0

長期以來，機器人技術的規模化應用面臨諸多挑戰，其中關鍵之一在于數據的割裂、動作表示的不統一以及空間理解能力的不足。不同廠商、不同形態的機器人往往使用各自獨立的數據體系，導致模型難以跨平臺復用，訓練效率受限，部署成本高。

高德推出的 ABot-M0 作為一款通用的具身操作基礎模型，從“數據統一—算法革新—空間感知”三個方面進行了系統性重構，致力于提升模型在多樣化機器人形態和任務場景下的泛化能力。

ABot-M0 基于全球開源資源，整合超過 600 萬條真實操作軌跡，構建了目前規模最大的通用機器人數據集。通過統一動作表示、坐標系與控制頻率，并采用增量式動作建模，實現了跨平臺數據融合，支撐了完全基于公開數據的預訓練。

算法革新上，ABot-M0 提出了全球首個動作流形學習：有效的機器人動作受限于物理規律、任務目標與環境約束，集中分布在低維結構化的流形上。設計了 AML（Action Manifold Learning）算法，使模型能夠直接預測結構合理、物理可行的動作序列，提升策略的穩定性與解碼效率。

為增強空間感知，ABot-M0 引入 3D 感知模塊，增強模型對“前后、遠近、遮擋”等空間語義的理解，在復雜環境中實現更精準的操作決策。

在 Libero、Libero-Plus、RoboCasa 基準測試中，該模型在包含復雜任務組合與動態場景擾動的設定下，平均任務成功率均達到 SOTA。其中，Libero-Plus 基準上達到了 80.5%，較業界先進方案pi0提升近30%，展現了其在高擾動高難度具身操作任務中的領先性能。

ABot-N0

導航是機器人進入物理開放世界的核心基礎能力，機器人需要在動態且存在干擾的環境里展現出通用的行動能力，如跨場景送物或跟隨服務，這同時也是具身智能演進的終極命題。

然而，當前的具身導航研究普遍深陷“碎片化”：主流方法往往針對特定任務構建孤立的專用架構，這不僅限制了模型的跨任務泛化能力，更阻礙了智能體從海量異構數據中提取統一物理先驗的可能性。

這也是當前機器人常陷于“環境看不懂、動作做不準”的核心原因，復雜指令（如“去門口幫我看看快遞”）更是難以執行。

高德推出的具身導航基座模型ABot-N0，以“全任務一統”為核心目標，并實現全球首次在單一模型中完整集成Point-Goal（點位導航）、Object-Goal（目標導航）、Instruction-Following（指令跟隨）、POI-Goal（興趣點導航）與Person-Following（人物跟隨）五大導航任務，有效突破了傳統架構中任務割裂的瓶頸。

比如，當用戶對搭載ABot-N0的具身機器人說：“帶我去奶茶店買一杯奶茶，再幫我占個座。”時系統會自動分解為具體的導航任務：首先執行Point-Goal，根據地圖記憶接近奶茶店區域；之后切換至POI-Goal，精準鎖定店鋪入口并靠近；隨后觸發Instruction-Following，進入店鋪并導航至柜臺；最后執行Object-Goal，在店內尋找空沙發并停靠。

相較于只能支持部分任務的具身導航模型，高德ABot-N0所實現的五大導航任務給長程復雜任務的執行提供了可行的解決方案。這一能力背后，是高德在架構設計、數據引擎和系統框架上的關鍵革新。

在模型架構上，ABot-N0采用層次化的“大腦?動作”設計哲學：由“認知大腦”理解指令并做推理，由基于流匹配（Flow Matching）的“動作專家”生成精確且多峰分布的連續軌跡。訓練上，先讓模型做認知訓練熱身，再用部分認知數據和海量導航動作進行聯合監督微調，最后用強化學習把導航決策對齊到人類偏好的行為價值，最終打造出真實環境中更通用的VLA基座模型。

在數據側，依托高德長期沉淀的場景資產和專家示例，高德構建了業內最大規模的具身導航數據引擎，涵蓋約 8000 個高保真 3D 場景等海量時空數據與近1700萬條專家示例，從而增強模型在真實環境中的泛化能力與魯棒性。

基于ABot-N0的系統性創新，其在CityWalker、SocNav、R2R-CE/RxR-CE、HM3D-OVON、BridgeNav、EVT-Bench七大權威基準測試中全面刷新了世界紀錄。其中在SocNav閉環仿真中，成功率（SR）飆升40.5%，在HM3D-OVON評測中成功率（SR）提升8.8%，均顯著強于之前的SOTA模型。

為了解決機器人在執行長程復雜任務時的任務拆解與容錯問題，高德提出了可落地的Agentic Navigation System具身導航系統框架，行成從“讀懂指令”到“長程復雜任務執行”的閉環能力架構，支持機器人在執行過程中持續感知、記憶、決策與糾錯。系統已成功部署于真實四足機器人平臺，并在邊緣側實現了高效推理與閉環控制，驗證了其在動態現實環境中的泛化性能與工業級穩定性。

更多>同類資訊

豆包上線Seedance2.0：馬斯克點贊美國導演稱或將顛覆好萊塢

02-12

字節發布Seedance 2.0：多模態升級，可控性提升，賦能工業級視頻創作

02-12

AI時代數據治理：企業數智化升級的基石與生成式AI落地的關鍵支撐

02-12

抖音“長輩模式”再升級：反詐預警通知為老人筑牢安全防線

02-12

蔡崇信憶阿里往事：被馬云直言“不懂運營”后轉崗，仍視其為導師

02-12

小米汽車響應《汽車行業價格行為合規指南》，共促產業公平高質量發展

02-12

小米YU7銷量一路高歌猛進，2026年1月強勢登頂國內乘用車銷冠寶座

02-12

百度智能云率先完成GLM-5適配，攜手昆侖芯P800賦能國產大模型生態發展

02-12

馬斯克感嘆豆包Seedance 2.0上線：視頻生成領域發展迅猛

02-12

字節跳動Seedance 2.0發布：能創電影級視頻，但研發團隊稱仍存瑕疵待完善

02-12

通義實驗室OpenClaw與通義曉蜜外呼融合打造企業招聘自動化新范式

02-12

馬斯克直播揭曉xAI新布局：華人聯創變動，超算與宇宙探索計劃曝光

02-12

阿里布局微信生態：蜜豆甜豆等小程序上線，免費模式探索漫劇新路徑

02-12

北京市場監管局約談12家火車票平臺規范經營保障旅客購票權益

02-12

高德自研具身導航基座模型將亮相，助力機器人跨場景服務升級

02-12

點擊查看更多 +

全站最新

前蘋果設計師助力法拉利，Luce內飾實體操控成亮點，5月亮相引期待

2026AMR展會：新能源維保領航，數字化賦能維修終端新未來

資金動向 | 北水加倉騰訊控股超14億，連續3日凈買入美團

新股暗盤｜海致科技集團暗盤收漲210.42% 一手賺11388港元

春節假期在機場、火車站打滴滴找準"滴滴車站"

成大生物（本溪）有限公司高劑量流感疫苗獲批開展臨床試驗

熱門內容

本欄最新

AI時代數據治理：企業數智化升級的基石與生成式AI落地的關鍵支撐

抖音“長輩模式”再升級：反詐預警通知為老人筑牢安全防線

Seedance 2.0引領AI視頻革命：技術突破、行業沖擊與未來展望

小紅書新規下“藍帽子”禁推勁酒流量退潮后增長路在何方

字節跳動Seedance 2.0：AI視頻生成新突破，引領全球創作新潮流

馬斯克點贊Seedance2.0，視頻模型發展迅猛引全球熱議

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

高德發布ABot具身操作和具身導航基座模型