智元近日宣布,在具身智能VLA模型的端側部署領域取得重大技術進展。通過整合算法優化與工程創新,該公司成功將π0.5 VLA模型在英偉達Jetson Thor芯片上的推理幀率從1.4Hz提升至22.1Hz,實現超過15倍的性能躍升。這一突破標志著機器人計算模式從依賴外掛桌面顯卡向完全端側推理的轉型邁出關鍵一步。
技術團隊通過全棧推理系統重構、算法邏輯深度優化、編譯工具鏈定制及低精度量化技術,系統性解決了端側部署的算力瓶頸。據研發人員透露,優化后的方案不僅在Jetson Thor芯片上實現了模型完整運行,更通過真機驗證確保了實際場景中的穩定性。以精靈G2機器人為載體的測試顯示,端到端推理延遲顯著降低,作業流暢度達到行業領先水平。
該成果直接回應了具身智能規模化落地的核心挑戰。傳統方案中,機器人需通過外接高性能顯卡完成復雜計算,導致系統成本高昂且場景適應性受限。智元的新方案將計算單元完全集成至端側芯片,使機器人具備自主決策能力的同時,大幅降低了硬件部署成本。測試數據顯示,優化后的系統在動態環境中的響應速度提升3倍以上,為工業巡檢、家庭服務等場景的應用奠定技術基礎。
行業分析師指出,此次突破重新定義了VLA模型的端側性能標準。此前業內最佳端側推理幀率約為15Hz,智元通過軟硬件協同創新將這一指標推至22.1Hz,為具身智能的實時交互能力開辟了新維度。隨著技術方案逐步開源,預計將加速推動機器人產業從實驗室原型向商業化產品的轉化進程。










