在具身智能產業邁向大規模應用的關鍵階段,數據短缺問題正成為制約行業發展的核心瓶頸。京東近日宣布啟動全球最大規模具身智能數據采集工程,計劃通過覆蓋超百個真實場景的百萬級人力參與,構建行業首個全維度數據生態體系,為破解這一難題提供系統性解決方案。
當前行業普遍面臨"大腦"與"小腦"發展失衡的困境:雖然機器人運動控制技術持續突破,但具身大模型因缺乏真實場景數據支撐,難以實現從實驗室到產業化的跨越。京東依托覆蓋零售、物流、健康等六大核心業務的超級供應鏈網絡,整合超過200個細分場景的運營數據,創新性提出"全場景數據采集+全流程數據處理"的雙輪驅動模式。該模式不僅涵蓋物流倉儲、工業制造等傳統領域,更延伸至家庭服務、城市運維等新興場景,形成完整的具身智能數據閉環。
在數據采集體系建設方面,京東已建成行業首個機器人數據采集中心,配備視覺、觸覺、空間軌跡等12類傳感器陣列,可實時捕獲超過200種環境參數。此次升級將動員內部10萬名專業員工與外部50萬行業從業者組成聯合采集團隊,僅在江蘇宿遷就規劃了10萬人規模的市民參與計劃。通過"專業采集+眾包采集"的協同機制,項目將實現從家庭廚房到工業產線、從社區街道到醫院病房的全場景覆蓋,預計單日可產生超過1.5萬小時有效數據。
根據規劃,該項目將在12個月內完成500萬小時人類行為視頻采集,同步積累100萬小時機器人本體運行數據。所有數據均經過脫敏處理和合規審查,通過區塊鏈技術確保數據可追溯性。京東技術團隊開發的智能標注系統,可將數據處理效率提升300%,使清洗后的有效數據占比達到85%以上。這些高質量數據將通過開放平臺向行業共享,助力具身智能模型實現從"感知-運動"到"認知-決策"的能力躍遷。
作為人工智能領域的新興賽道,具身智能市場正以每年45%的增速擴張。京東此次構建的數據基礎設施,不僅為自身在機器人感知、決策、執行全鏈條的技術突破奠定基礎,更通過降低行業數據獲取成本,推動具身智能從算法仿真階段向真實世界交互階段轉型。隨著首批數據集的陸續開放,醫療護理機器人、工業巡檢機器人等垂直領域有望率先實現智能化升級,為萬億級智能服務市場注入新動能。







