近日,支付寶(杭州)數字服務技術有限公司在專利領域取得新進展。據愛企查App披露,該公司公布了一項名為“具身智能體的控制方法、模型訓練方法、設備和存儲介質”的發明專利,引發行業關注。
該專利的核心在于一種創新的控制方法。在具身智能體執行目標任務的過程中,系統會首先獲取其當前時間步的觀測環境數據。這些數據是智能體感知周圍環境的關鍵信息,為后續決策提供基礎。
獲取到當前數據后,系統并不會孤立地處理。而是將當前時間步的觀測環境數據,與具身智能體在目標任務各歷史時間步的歷史運行數據進行整合。這種整合并非簡單疊加,而是為后續模型分析提供全面的數據支撐。
整合后的數據會被輸入至經訓練的自回歸預測模型。該模型經過大量數據訓練,具備強大的預測能力。通過分析輸入的數據,模型能夠預測下一時間步的預測環境數據。這一預測結果至關重要,它是智能體下一步行動的重要依據。
基于預測出的下一時間步環境數據,系統會進一步推理出具身智能體所需執行的目標動作。這一推理過程結合了智能體的任務目標、當前狀態以及環境變化等多方面因素,確保動作的合理性和有效性。
最后,系統會控制具身智能體執行推理出的目標動作,使其能夠更好地適應環境變化,完成目標任務。這一專利的公布,展示了支付寶在智能體控制技術領域的探索成果,也為相關領域的技術發展提供了新的思路和方向。












