滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

李想汽車Base Model團隊突破：AI告別被動使用，開啟主動創造工具新時代

時間：2026-02-05 00:42:03 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

人工智能領域迎來一項突破性進展——李想汽車Base Model團隊開發的UCT框架，讓AI智能體首次具備了自主創造工具的能力。這項發表于arXiv平臺的研究（編號：arXiv:2602.01983v1），通過構建"經驗復用"機制，使AI在解決復雜問題時能夠動態生成專用工具，而非依賴預設工具庫。實驗數據顯示，該框架在959個高難度推理任務中，將基礎模型性能提升最高達23.04%，標志著AI從工具使用者向創造者的關鍵轉型。

傳統AI系統在面對特殊需求時，往往因工具庫的局限性而受阻。例如計算特殊曲線圍成面積時，現有模型可能因缺乏專用工具而失敗。UCT框架通過三個核心模塊破解這一難題：在線任務循環作為"指揮中樞"，負責問題分析與行動決策；在線工具構建循環作為"智能車間"，根據需求自動生成工具代碼與測試腳本；離線記憶整合模塊作為"倉庫管理員"，持續優化工具庫結構。這種設計使AI在無需額外訓練的情況下，通過經驗積累實現能力躍遷。

工具質量控制是該系統的核心創新之一。每個新工具需經歷嚴格的"生產流程"：自動生成的測試腳本會在沙箱環境中驗證功能，AI評論員則從代碼規范、邏輯嚴謹性等維度進行審查。若發現缺陷，系統會基于前序版本、測試反饋與評論意見進行迭代優化，直至通過全部質量關卡。這種機制確保了工具庫中93.1%的工具至少被復用一次，86%的工具使用次數超過五次，形成具有實際價值的工具生態。

研究團隊構建的TRBench評測基準，專門針對工具推理能力設計，包含數學、科學計算與視覺問答三大領域的959個挑戰性問題。在求解曲線圍成面積的積分問題時，UCT系統自動創建專用計算工具，準確率較傳統思維鏈方法提升顯著；處理放射性衰變計算時，系統能理解科學概念并生成數學模型工具；面對視覺問答中的對象識別需求，則可動態開發圖像分析工具。實驗表明，即使搭載Gemini-2.5-pro等強基模型，UCT框架仍能帶來20.86%的性能增益。

工具庫的演化過程印證了系統的自我優化能力。經過大量任務訓練，系統自主構建出包含7大類、64子類與207個具體工具的生態體系。代數工具占比最高，幾何工具形成專業化分支，統計分析工具則呈現精細化發展趨勢。離線模塊通過分析工具使用模式，自動合并功能重疊工具、淘汰低效工具，使工具復用率持續提升。這種有機生長機制，使系統在數學推理任務中的準確率從初始的60%逐步提升至90%以上。

盡管展現強大潛力，研究團隊也指出系統現存挑戰。自動生成工具在邊界條件下仍可能存在誤差，開放領域任務的適應性需進一步驗證，工具庫規模擴張帶來的檢索效率問題也需優化。不過，UCT框架的模塊化設計為持續改進提供了基礎——各組件可獨立升級，基礎模型能力的提升將直接轉化為系統性能的增強。研究團隊同步開放的TRBench基準，為全球AI研究者提供了標準化的工具推理能力評估平臺。

這項突破重新定義了AI的能力邊界。當傳統系統還在遵循"輸入-處理-輸出"的固定模式時，UCT框架已構建起"學習-創造-優化"的閉環系統。其核心價值不在于解決特定問題，而在于開創了AI自主進化的新路徑。正如研究論文所展示的，當AI能夠根據需求創造工具時，它離真正理解問題本質、形成創造性解決方案的目標，已邁出關鍵一步。

更多>同類資訊

2026全球開發者先鋒大會3月上海啟幕，六大方向促產業資源高效對接

2026全球開發者先鋒大會的核心使命，正是在這一歷史轉折點上，為全球開發者與產業界搭建一個系統級驗證平臺——讓產業界為學術科研出題，讓AI4S+Agent為產業應用答題，讓技術為超級個體（SE）及開發者社區…

02-16

香港教育大學科技賦能教育：Joey機器人、EmoCare應用及ADHD智能背心亮相

近日，香港八大名校之一的香港教育大學(教大)公布了多項教育科技成果：語言學習社交機器人Joey、情緒健康應用EmoCare及ADHD智能背心。教大心理學系副教授佟秀紅認為，從教育心理學角度看，智能背心為AD…

02-16

“孔孟之鄉”科技年味濃：200余臺機器人共舞演繹古今交融新春盛宴

“這是全國機器人企業與濟寧的一次‘雙向奔赴’。”來自東莞松山湖畔的本末科技有限公司對外關系總監劉西同坦言，晚會為企業搭建了同臺競技的難得舞臺；而濟寧扎實的機器人產業基礎與豐富應用場景，同樣也吸引著企業紛至沓…

02-16

古爾曼爆料：蘋果iOS 27聚焦代碼清理與應用升級，AI功能成新亮點

02-16

蘋果新版Siri今年將至：雖遇阻礙仍推進，功能升級令人期待

近日有消息提到，蘋果在為iOS 26.4測試更個性化、更智能的新版Siri時遇到了阻礙。參與測試iOS 26.5的員工表示，該更新包含蘋果此前承諾的全部功能：個性化、屏幕感知，以及Siri在應用內和應用間完…

02-16

宇樹科技王興興談具身智能：AI模型能力待提升，產業尚處爬坡期

【太平洋科技】2月15日消息，宇樹科技CEO王興興接受央視財經采訪時指出，當前具身智能領域面臨的最大問題是AI模型本身能力不足，尤其是泛化能力和通用性不夠。他以端到端訓練為例：機器人在固定場景下成功率基本…

02-16

2026春節檔佳片薈萃，AI購票新體驗為電影市場添活力

02-15

AI賦能出境游：從“負重前行”到“輕裝上陣”的安心之旅

02-15

6G賦能工業智能化：2025年協同場景與需求深度剖析

在架構與技術層面，報告提出6G網絡與業務協同系統由感知、數據分析、決策三大核心模塊構成，可基于數據驅動的分布自制架構和AI Agentic架構實現，同時明確了業務特征識別、AI數據分析、AI業務智能調度與編…

02-15

春節自駕返鄉潮涌，長三角如何“智解”新能源充電難題？

02-15

千問超級請客卡上線首日：縣城鐘點房幫訂數量暴增約300%

02-15

馬年春節將至，神舟二十一號乘組太空“忙年”實錄大公開！

在軌腦電測試研究相關項目按計劃開展，乘組使用近紅外腦功能成像設備開展空間腦網絡時變特性實驗，開展長期空間飛行環境對航天員腦功能網絡影響及大腦對外部環境變化進行的自發調整與適應機制研究。在太空微重力環境下，腳…

02-15

捷龍三號遙九海上發射成功 “亦莊箭”攜“亦莊星”開啟太空新程

2月15日，北青報記者從經開區獲悉，2月12日14時37分，在廣東陽江近海海域，亦莊企業中國長征火箭有限公司（以下簡稱“中國火箭公司”）的捷龍三號遙九運載火箭點火升空，以“一箭七星”海上發射方式，成功將巴基…

02-15

龍芯3B6000M“小盒子”落地：國產芯片賦能AI，開啟低成本高安全新篇章

02-15

千問“超級請客卡”助力情人節消費：縣城鐘點房預訂量激增約300%

02-15

點擊查看更多 +

全站最新

問界M8斬獲“風云2025智行汽車” 問界以智慧科技引領高端智能汽車新未來

馬自達未棄轉子發動機：雖不量產性能車，但仍有希望盼未來

總臺第六屆《汽車風云盛典》啟幕以“全維安全”引領汽車產業新征程

觸屏操作遇挑戰！新規推動駕駛核心功能回歸實體按鍵科技與安全并重

馬自達6e英國上市，售價超中國兩倍，這差價背后藏著啥秘密？

北汽極狐阿爾法S5煥新登場！增程版上線，續航焦慮不再有

熱門內容

本欄最新

春節自駕返鄉潮涌，長三角如何“智解”新能源充電難題？

廣汽馮興亞談行業挑戰：身處“四期疊加”關口，堅定變革謀發展

春運“科技范兒”十足：充電新招、交通調度、文旅融合齊上陣

客易云劇本改寫牽手數字人：AI賦能創作，開啟內容產業新想象

螞蟻開源萬億參數模型Ring-2.5-1T：架構創新破“不可能三角”，邏輯推理與速度雙飛躍

佟歐福全球財報會首秀定調在華戰略奔馳加速本土化三年推超40款新車

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

李想汽車Base Model團隊突破：AI告別被動使用，開啟主動創造工具新時代