在2024年Kaggle AutoML大獎(jiǎng)賽中,一支由自動(dòng)化智能體組成的團(tuán)隊(duì)以獨(dú)特的技術(shù)路徑脫穎而出。這項(xiàng)匯聚全球頂尖AutoML從業(yè)者的賽事,最終由一支完全依賴零代碼框架的隊(duì)伍斬獲第十名,成為唯一獲得積分的自動(dòng)化參賽者。該成果不僅驗(yàn)證了技術(shù)路線的可行性,更引發(fā)業(yè)界對機(jī)器學(xué)習(xí)開發(fā)范式變革的深入思考:當(dāng)模型選擇、超參數(shù)調(diào)優(yōu)乃至編碼工作均可被系統(tǒng)自動(dòng)完成時(shí),機(jī)器學(xué)習(xí)的門檻是否將徹底消失?
傳統(tǒng)AutoML工具雖宣稱簡化流程,但實(shí)際仍要求用戶具備數(shù)據(jù)處理、API調(diào)用等基礎(chǔ)能力。這種技術(shù)門檻將大量非編程背景的領(lǐng)域?qū)<揖苤T外——無論是分析實(shí)驗(yàn)數(shù)據(jù)的科研人員,還是處理醫(yī)學(xué)影像的研究者,都不得不依賴專業(yè)工程師完成模型構(gòu)建。針對這一痛點(diǎn),研究團(tuán)隊(duì)開發(fā)出基于MLZero架構(gòu)的AutoGluon助手,通過多智能體協(xié)作系統(tǒng)實(shí)現(xiàn)從自然語言指令到可部署模型的端到端自動(dòng)化。
該系統(tǒng)的核心創(chuàng)新在于其四模塊協(xié)同架構(gòu)。感知模塊如同"數(shù)據(jù)翻譯官",能夠解析模糊的文件格式與語義模糊的任務(wù)描述。當(dāng)用戶上傳帶有分割掩碼的醫(yī)學(xué)影像并要求"定位疾病區(qū)域"時(shí),系統(tǒng)可自動(dòng)識別任務(wù)類型為像素級分割。語義記憶模塊則充當(dāng)"智能工具箱",根據(jù)任務(wù)特征從AutoGluon庫中匹配最佳算法組合,例如在語義分割場景中自動(dòng)選用SAM模型。情節(jié)記憶模塊通過記錄每次嘗試的成敗細(xì)節(jié),構(gòu)建出動(dòng)態(tài)調(diào)試知識庫,當(dāng)代碼因掩碼格式不兼容報(bào)錯(cuò)時(shí),系統(tǒng)可追溯歷史記錄調(diào)整預(yù)處理流程。迭代編碼模塊則負(fù)責(zé)將上述決策轉(zhuǎn)化為可執(zhí)行代碼,并通過反饋循環(huán)持續(xù)優(yōu)化解決方案。
在技術(shù)驗(yàn)證環(huán)節(jié),研究團(tuán)隊(duì)構(gòu)建了雙層測試體系。外部基準(zhǔn)測試選用MLE-bench Lite,該平臺匯集21個(gè)Kaggle競賽任務(wù),要求系統(tǒng)直接提交可參賽的解決方案。測試結(jié)果顯示,AutoGluon助手以86%的任務(wù)完成率登頂榜首,平均排名1.43的指標(biāo)領(lǐng)先第二名40%。內(nèi)部基準(zhǔn)測試則設(shè)置更高門檻,25個(gè)任務(wù)全部采用未清洗的原始數(shù)據(jù),包含多語言文本、多表格結(jié)構(gòu)等復(fù)雜場景。在此條件下系統(tǒng)仍保持92%的成功率,即便使用80億參數(shù)的輕量化模型,性能依然超越多數(shù)參評的大規(guī)模系統(tǒng)。
系統(tǒng)設(shè)計(jì)充分考慮實(shí)際應(yīng)用場景的多樣性。研究人員開發(fā)了四種交互模式:命令行接口滿足快速自動(dòng)化需求,Python API支持無縫嵌入現(xiàn)有數(shù)據(jù)管道,Web界面提供可視化監(jiān)控能力,MCP協(xié)議則實(shí)現(xiàn)與其他智能體工具的協(xié)同工作。特別設(shè)計(jì)的專家介入機(jī)制允許用戶在關(guān)鍵節(jié)點(diǎn)提供指導(dǎo),例如醫(yī)學(xué)影像處理中可指定符合特定掃描協(xié)議的標(biāo)準(zhǔn)化流程,系統(tǒng)會(huì)自動(dòng)將專業(yè)意見轉(zhuǎn)化為代碼調(diào)整策略。
這項(xiàng)突破性成果已通過開源方式向社區(qū)開放,其技術(shù)細(xì)節(jié)完整披露于NeurIPS 2025會(huì)議論文。研究團(tuán)隊(duì)特別強(qiáng)調(diào),系統(tǒng)的成功不依賴于更大規(guī)模的模型參數(shù),而是源于架構(gòu)設(shè)計(jì)的本質(zhì)創(chuàng)新。通過解耦數(shù)據(jù)理解、工具選擇、歷史追蹤與代碼生成等核心功能,多智能體架構(gòu)展現(xiàn)出超越單體系統(tǒng)的適應(yīng)性與效率。這種設(shè)計(jì)哲學(xué)或許預(yù)示著,未來的機(jī)器學(xué)習(xí)開發(fā)將不再需要開發(fā)者在數(shù)據(jù)清洗、算法選型等低級任務(wù)上消耗精力,而是專注于真正創(chuàng)造價(jià)值的領(lǐng)域知識整合。












