滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

螞蟻靈波開源LingBot-Depth模型，為機器人空間感知難題提供新解法

時間：2026-01-28 17:06:12 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

螞蟻集團旗下具身智能公司靈波科技近日宣布開源高精度空間感知模型LingBot-Depth，該模型通過算法創新顯著提升了消費級RGB-D相機的深度感知能力，在機器人領域引發廣泛關注。搭載該模型的奧比中光Gemini 330系列相機在深度精度和像素覆蓋率等核心指標上，已超越行業頂級深度相機，為機器人精準交互提供了關鍵技術支撐。

在機器人落地應用過程中，空間定位感知是核心前提。傳統RGB-D相機受硬件限制，在鏡面反射、無紋理表面等場景下易產生深度誤差，導致機器人無法準確判斷自身位置。LingBot-Depth模型通過掩碼深度建模（MDM）機制，將傳感器失效區域視為可學習的結構線索，利用RGB圖像中的視覺上下文信息智能推斷缺失深度，從而生成貼合物理世界的高精度完整深度表示。這一創新使機器人在抓取透明、反光物體時的成功率大幅提升，測試中透明收納箱抓取成功率從0%提升至50%，多種反光和透明物體的抓取成功率提高30%～78%。

技術評測顯示，LingBot-Depth模型在主流3D視覺基準數據集NYUv2、ETH3D上的表現遠超PromptDA、PriorDA等業界主流模型。在室內場景下，其相對誤差（REL）降幅超70%；在高挑戰性的稀疏SfM任務中，均方根誤差（RMSE）降低約47%。該模型生成的深度圖具備更清晰的邊界和更連貫的結構特征，尤其在遮擋嚴重或觀測信息稀疏的區域優勢明顯。在單目深度估計任務中，LingBot-Depth在10項基準上的表現均優于視覺模型DINOv2，其預訓練范式有效將3D幾何知識融入編碼器，提升了從單目圖像推斷深度結構的能力。

為支持大規模MDM訓練，研究團隊構建了包含1000萬條樣本的多樣化高質量訓練集。該數據集通過自托管3D資產生成合成數據，并利用模塊化3D打印采集裝置完成實景數據采集，兼容多款消費級RGB-D相機。所有樣本均包含同步的RGB圖像、原始傳感器深度數據及立體圖像對，其中立體圖像對的偽深度監督由自定義立體匹配網絡實現。結合這一數據集，研究團隊采用掩碼深度建模方式對ViT-Large模型進行預訓練，通過注意力機制將度量幾何信息融入語義標記，顯著提升了RGB-D相機的空間感知質量。

在實際應用驗證中，LingBot-Depth模型展現出高實用性與落地潛力。在3D點跟蹤任務中，面對大面積玻璃場景時，原始深度傳感器嚴重失效，而經該模型優化后的深度數據能夠生成更平滑精確的相機軌跡。在靈巧手抓取實驗中，配備X Hand-1靈巧手的Rokae XMate-SR5機械臂使用Orbbec Gemini 335 RGB-D相機，在抓取高度透明物體時的成功率達到50%，而原始方法完全無法完成抓取。這些測試場景均對標機器人落地應用中的高頻實際場景，充分證明了該技術方案的有效性。

目前，靈波科技已開源LingBot-Depth模型的代碼和檢查點，并計劃近期開源300萬個RGB深度對數據，包括200萬個真實數據和100萬個合成數據。這一舉措或將推動RGB-D相機硬件的優化升級，進一步提升模型在真實長尾場景中的魯棒性。通過降低技術落地成本，該模型為各類智能應用的開發奠定了堅實基礎，開發者可直接基于該模型快速搭建應用，加速機器人、自動駕駛汽車等產品從技術概念向現實場景的轉化。

更多>同類資訊

OpenAI發布Prism科研協作空間：GPT-5.2驅動助力科研團隊高效協作

01-28

國產GPU新突破：架構路線圖明晰，全棧布局開啟商業化放量新篇章

01-28

馬云談AI時代教育變革：讓孩子用好奇心與創造力跨越時代鴻溝

01-28

全國首例AI“幻覺”侵權案落槌：生成不實信息為何未被認定侵權？

01-28

OpenAI CEO奧爾特曼警示：AI便利性下，安全防線或因“妥協”而崩塌

01-28

ASML進軍半導體后工序光刻半導體設備廠商競爭格局生變

01-28

農業AI大模型：為農田裝上“數字大腦” 開啟智慧農業新篇章

江蘇叁拾叁智慧農業有限公司正在進行的探索，核心在于通過其自主研發的農業AI大模型，將這種彌漫在農業系統中的不確定性，盡可能地轉化為可分析、可預測、可優化的確定性。它通過構建動態的數字孿生、實現從預測到處方的決…

01-28

螞蟻靈波科技開源LingBot-VLA模型，推動具身智能跨本體跨任務落地新突破

作為一款面向真實機器人操作場景的“智能基座”，LingBot-VLA實現了跨本體、跨任務泛化能力，并大幅降低后訓練成本，推動“一腦多機”走向工程化落地。長期以來，由于本體差異、任務差異、環境差異等，具身智…

01-28

魏牌V9X定名亮相基于歸元平臺打造集成長城汽車前沿技術

01-28

魏牌全新旗艦SUV V9X定名歸元平臺賦能打造個性化出行新體驗

01-28

范式戴文淵：AI生態現兩極分化國產算力崛起有望打破英偉達主導格局

但非常遺憾的一點，我們現在99%的，哪怕是在中國的中國人做的AI應用，也是英偉達體系下的，不是在國產的信創體系下。”當然，在干這件事情之前，我們也要看到這方面的差距，因為沒有差距就沒有我們的價值，也不需要我們…

01-28

孫正義豪賭OpenAI：軟銀擬追加投資300億美元

01-28

iPhone 18有望不漲價消息稱蘋果策略是盡可能不上漲

01-28

軟銀擬再向OpenAI注資300億美元，已拋售英偉達股份套現籌措資金

01-28

螞蟻靈波科技開源兩大模型：LingBot-VLA與LingBot-Depth助力智能終端升級

01-28

點擊查看更多 +

全站最新

物理AI的"世界模擬器"來了！文遠知行發布通用仿真模型WeRide GENESIS

中核國際榮獲香港《信報》"上市公司卓越大獎2025"

三重邏輯引爆稀有金屬

魏牌V9X定名亮相基于歸元平臺打造集成長城汽車前沿技術

魏牌全新旗艦SUV V9X定名歸元平臺賦能打造個性化出行新體驗

華為乾崑啟境首款獵裝轎跑：零下30度嚴寒測試，駕控體驗超預期

熱門內容

本欄最新

魏牌V9X定名亮相基于歸元平臺打造集成長城汽車前沿技術

魏牌全新旗艦SUV V9X定名歸元平臺賦能打造個性化出行新體驗

范式戴文淵：AI生態現兩極分化國產算力崛起有望打破英偉達主導格局

螞蟻靈波科技開源兩大模型：LingBot-VLA與LingBot-Depth助力智能終端升級

長城魏建軍官宣：魏牌V9X攜歸元平臺來襲，AI豪華六座旗艦款即將亮相

一汽-大眾全新速騰S來襲，運動設計+智能升級，A級車市場新變局

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

螞蟻靈波開源LingBot-Depth模型，為機器人空間感知難題提供新解法