螞蟻集團近日宣布開源全球首個基于混合線性架構的萬億參數思考模型Ring-2.5-1T,標志著AI大模型領域在長文本處理與復雜任務規劃能力上取得突破性進展。該模型在生成效率、推理深度和長時程任務執行能力三大核心指標上實現顯著提升,尤其在數學競賽、代碼生成和智能體任務執行等場景中展現出開源模型領先水平。
在數學推理能力驗證中,Ring-2.5-1T在國際數學奧林匹克競賽(IMO 2025)自測中取得35分(滿分42分),中國數學奧林匹克(CMO 2025)自測中更以105分遠超金牌線78分和國家隊集訓隊選拔線87分。對比前代模型Ring-1T,新模型在推理邏輯嚴謹性、高級數學證明技術應用和答案完整性方面均有顯著優化。在編程能力測試中,該模型在LiveCodeBench-v6代碼生成基準中超越所有對比模型,展現出強大的工程化落地潛力。
技術架構層面,Ring-2.5-1T基于創新的Ling 2.5混合線性注意力架構,通過將傳統GQA(分組查詢注意力)升級為MLA(多頭線性注意力)與Lightning Linear結構的1:7混合比例,在保持63B激活參數規模的同時,將內存訪問開銷降低至前代的1/10。實驗數據顯示,在32K以上長文本生成場景中,模型生成吞吐量提升超3倍,且隨著序列長度增加,效率優勢持續擴大。在配備8塊H200 GPU的測試環境中,當生成長度超過16K tokens時,其解碼吞吐量較傳統架構模型高出40%以上。
針對復雜任務執行場景,研究人員通過大規模完全異步智能體強化學習訓練,使模型具備跨應用工具協作能力。在智能體搜索任務Gaia2-search中,Ring-2.5-1T在規劃生成和多步工具調用準確率上達到開源模型最優水平,較Kimi-K2.5-Thinking等競品提升23%。該模型已實現與Claude Code智能體編程框架和OpenClaw個人AI助手的快速適配,支持多步驟工具調用與動態規劃生成。
在開源生態建設方面,螞蟻集團同步在Hugging Face、ModelScope等平臺發布模型權重與推理代碼,并計劃于近期上線官方Chat體驗頁和API服務。對比測試顯示,在AIME 26數學推理、HMMT 25競賽數學等高難度基準測試中,Ring-2.5-1T均實現開源模型最佳性能,在SWE-Bench Verified軟件工程任務執行基準中更以87.6%的通過率領先第二名14個百分點。這些突破為金融、科研、工業等領域處理超長文檔、復雜業務流程提供了新的技術路徑。











