岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

小米發布并開源首款機器人VLA大模型Xiaomi-Robotics-0 刷新具身智能多項紀錄

時間：2026-02-12 19:16:08 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

小米近日在具身智能領域邁出重要一步，正式推出并開源首款機器人視覺語言動作（VLA）大模型Xiaomi-Robotics-0。該模型以47億參數規模實現視覺語言理解與實時動作執行的深度融合，在消費級顯卡上即可完成毫秒級推理，成功突破傳統VLA模型因延遲導致的物理世界交互瓶頸，多項性能指標刷新行業紀錄。

針對現有VLA模型普遍存在的"大腦發達但肢體遲緩"問題，研發團隊創新采用MoT混合架構構建雙核心體系。其中多模態視覺語言大模型（VLM）作為認知中樞，可解析人類模糊指令并精準識別三維空間關系；多層擴散Transformer（DiT）構成的運動控制模塊則通過"動作塊"生成技術，將復雜動作拆解為高頻執行單元，配合流匹配算法實現肢體運動的毫米級精度控制。這種"認知-執行"分離設計使機器人既能理解"把水杯遞給穿紅衣服的人"這類抽象指令，又能流暢完成抓取、遞送等連續動作。

在訓練體系構建上，小米開創性設計兩階段強化方案。跨模態預訓練階段通過Action Proposal機制建立視覺特征與動作空間的映射關系，在凍結VLM參數的同時專項優化DiT模塊，確保模型同時具備物體識別、邏輯推理等基礎能力與操作技能。后訓練階段引入異步推理框架破解真機部署難題，Clean Action Prefix技術保障動作序列的連貫性，Λ-shape注意力掩碼則使模型更聚焦實時視覺反饋，環境適應速度提升3倍以上。

目前該項目已實現全面開源，技術文檔、訓練代碼及預訓練權重均對外開放。小米機器人實驗室同步啟動全球人才招募計劃，重點引進多模態學習、運動控制、人機交互等領域的頂尖專家，持續探索物理世界與數字智能的融合邊界。此次開源不僅為學術界提供先進研究基線，更為工業界落地具身智能應用掃清關鍵技術障礙。

VLM 協同訓練：首先引入了 Action Proposal 機制，強迫 VLM 模型在理解圖像的同時預測多種動作分布。針對推理延遲引發的真機“動作斷層”問題，團隊采用異步推理模式 —— 讓模型推理與機…

02-12

Seedance 2.0引領AI視頻革命：技術突破、行業沖擊與未來展望

從“讓圖動起來”到“讓AI會拍片”，二代AI視頻模型的進化，不僅是創作者的效率革命，更預示著對內容創作行業的沖擊真的來了。吳杰茜也表示，AI視頻生成模型從誕生之初，就對視頻自媒體、動畫媒體、影視行業的創作…

02-12

小紅書新規下“藍帽子”禁推勁酒流量退潮后增長路在何方

當下勁酒正呈現高增長態勢，2025年核心單品預計增長20%，紅標勁酒上半年銷量激增超50%，品牌消費群體中年輕及女性用戶大幅上升。此前，該產品通過小紅書等社交平臺獲得了顯著的市場曝光與熱度，并帶動了銷量的顯…

02-12

字節跳動Seedance 2.0：AI視頻生成新突破，引領全球創作新潮流

馬斯克點評Seedance 2.0在視頻效果上的進步這個名為Seedance2.0的視頻生成模型剛剛開始在中國進行小范圍測試，但各種超逼真的合成視頻已在全球各大社交平臺刷屏。據彭博新聞社報道，受該模型…

02-12

馬斯克點贊Seedance2.0，視頻模型發展迅猛引全球熱議

近日，字節跳動視頻模型Seedance2.0火到海外。馬斯克在其社交平臺X轉發評論Seedance2.0相關推文，并感慨模型發展速度太快（It'shappening fast）。此前，字節跳動視頻模型Se…

02-12

AI購物新熱潮：武漢等十城領跑千問《AI生活觀察報告》揭秘消費新活力

活動上線6天，用戶用千問下單了1000多噸雞蛋、超過2300件健身器材和1500多本圖書……隨著春節臨近，用AI來閃購零食、飲料、牛奶、水果、鮮花等年貨成為最新趨勢，帶動了淘寶閃購即時零售訂單快速增長。在縣城…

02-12

iOS 26.3 正式版更新：數據遷移優化新功能與漏洞修復齊登場

那么在 iOS 26.3 中，顯然也帶來了一些與國行用戶暫時無緣的功能。面向歐盟用戶，蘋果在新系統中新增了一個名為「通知轉發」的功能。作為一個大版本更新，蘋果在 iOS 26.3 中修復了海量的系統漏洞…

02-12

開放式耳機怎么選？從佩戴到音質，8款熱門型號深度測評與選購指南

音質方面，耳機內置有17mm大尺寸動圈單元，并支持360°全景環繞音效，中高頻的解析力不錯，人聲的表現清晰自然，聽流行音樂和輕音樂較為舒適。同時在漏音控制方面表現良好，低頻量感和下潛深度在開放式耳機中屬于優…

02-12

中國移動“九天AlphaData”國際評測奪冠引領智能數據分析新潮流

為此，九天AlphaData應運而生——它深度融合AI技術，集成數據問答、多輪對話、智能決策與可視化圖表生成等能力，覆蓋從數據查詢、處理、分析到展示的全流程，真正實現了數據驅動決策的閉環。在指標問答與經營分析…

02-12

中國電信北斗短信業務獲批持續創新拓展多元場景賦能產業新未來

其中，天通無人機電子信標產品整合物聯網、5G、北斗定位及高精度慣導等技術，依托“衛星+ 5G”天地一體通信能力，為無人機在復雜環境或遠距離飛行時提供實時位置跟蹤、狀態監測與應急通信保障；北斗+智能時空云，以全…

02-12

蘋果再突破！iPhone 18 Pro系列將首發C2基帶開啟5G衛星連接新時代

簡單來說，蘋果C2基帶與NR-NTN標準的結合，被業內視為5G衛星連接技術的一次重大變革，它徹底打破了地理環境對通信的限制。在實際使用中，iPhone 18 Pro系列將能夠把每一顆運行中的低軌道衛星視為一…

02-12

賈樟柯感嘆字節Seedance 2.0確實厲害，計劃用其制作短片

02-12

摩爾線程實現智譜GLM-5大模型Day-0適配

02-12

智譜上線開源GLM-5，與華為昇騰、摩爾線程等深度適配

02-12

京東與美的、海爾、海信、TCL簽署2026戰略合作協議

02-12

點擊查看更多 +

全站最新

華爾街新交易邏輯：先賣了再說！

龍虎榜丨百川股份跌4.92%，四機構凈買入2.26億元

龍虎榜丨中材科技兩連板創新高，深股通凈買入5.26億元，四機構凈買入1.36億元

春節假期在機場、火車站打滴滴找準"滴滴車站"

幺麻子再闖IPO，與海天味業競爭，食品安全風險被問詢

電網設備集體走強，電網設備ETF、電網ETF、電網設備ETF廣發漲超3%

熱門內容

本欄最新

小米新一代SU7卡布里藍2月13日到店，7城30店率先開啟品鑒之旅

雷軍宣布小米開源首代機器人VLA大模型Xiaomi-Robotics-0 布局已久邀英才

豆包視頻生成模型Seedance 2.0發布，多模態全能助力創作，2月中下旬API服務將上線

馬斯克點贊Seedance 2.0引關注，字節加速布局視頻生成賽道仍自謙“不完美”

AI購物時代來臨！千問助力消費升級，縣域銀發族也享數字便利

小米汽車新一代SU7卡布里藍明日到店 7城30店率先開啟品鑒之旅

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.