上海交通大學聯合科研團隊近日宣布,其開發的AI自主研發系統ASI-EVOLVE取得重大突破,這項成果已在arXiv平臺公開,編號為arXiv:2603.29640v1。該系統首次實現AI自主完成從知識學習到方案優化的完整科研閉環,在模型架構設計、數據處理及算法優化三大領域展現出超越人類專家的能力,為人工智能發展開辟全新路徑。
研究團隊構建的ASI-EVOLVE系統包含五大核心模塊:研究員模塊負責生成創新方案,工程師模塊執行實驗驗證,分析師模塊提煉經驗教訓,認知庫存儲專業知識,數據庫記錄完整研究歷程。這套系統通過持續迭代實現自我進化,每輪循環都會將實驗結果轉化為新的知識儲備,形成"學習-設計-實驗-分析"的螺旋上升模式。在神經架構設計任務中,系統僅用1773輪探索就生成1350個原創架構,其中105個超越人類設計的基準模型,最佳方案性能提升達0.97分,是近期人類專家改進效果的三倍。
數據處理領域同樣見證系統威力。面對海量異構數據,ASI-EVOLVE自動識別網頁文本、學術文獻、社交媒體等不同數據源的質量問題,設計針對性清洗策略。經優化處理的數據使模型在知識密集型任務中表現躍升:MMLU基準提升18.64分,醫學問答MedQA提升13.48分。這種自動化處理流程不僅提升效率,更建立起數據質量與模型性能的量化關聯,為AI訓練數據優化提供新范式。
在強化學習算法設計方面,系統從GRPO算法出發,通過300輪進化實驗開發出新型變體。最優算法在數學推理任務中表現卓越:AMC32提升12.5分,AIME24提升11.67分。這些突破源于算法創新,如成對非對稱優化策略通過樣本間比較確定優勢,預算約束動態半徑策略則像家庭理財般合理分配訓練資源。這些設計使算法在保持穩定性的同時,顯著提升復雜任務處理能力。
系統能力邊界測試同樣令人矚目。在圓形裝箱優化問題中,ASI-EVOLVE僅用17輪迭代就達到2.63597的得分,最終結果與全球最佳解僅相差0.000013。消融實驗顯示,分析師模塊的持續反饋使系統能突破性能平臺期,而認知庫則幫助系統快速建立知識基線。當移除認知庫時,系統雖能通過自主探索最終達到相似性能,但收斂速度大幅下降,凸顯先驗知識的重要性。
跨領域應用驗證中,系統在藥物-靶標相互作用預測任務展現強大泛化能力。針對全新藥物或蛋白質的冷啟動場景,AI設計的架構使AUROC指標提升最高達6.94分。最佳架構融合三項關鍵創新:Sinkhorn注意力機制確保分配平衡,領域特定邊緣化策略實現組合建模,Top-k稀疏門控機制降低特征干擾。這些設計選擇精準對應生物分子結合的物理規律,證明系統已具備理解問題本質的能力。
技術實現層面,系統采用多層次分析機制處理復雜實驗數據。在神經架構任務中,分析師模塊需同時解析數十個性能指標、訓練動態曲線及計算效率數據。通過量化分析、模式識別和因果推理的三級處理,系統能準確診斷問題根源并提出改進方向。數據庫的智能采樣策略則平衡探索與利用,UCB1算法在知識充足時優先選擇高潛力方案,MAP-Elites算法通過并行進化分支防止過早收斂。
這項突破引發學界對科研范式的深度思考。傳統AI研發依賴人類專家進行架構設計、數據篩選和算法調優,而ASI-EVOLVE證明AI可承擔這些基礎工作。研究團隊強調,人類研究者將轉向更高層次的戰略規劃,如定義研究目標、評估社會影響及把控倫理邊界。系統開源決定更體現科研共享精神,全球開發者現已可通過GitHub獲取完整代碼和文檔,共同推進AI自主研發技術發展。











