滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

螞蟻集團發布萬億參數思考模型Ring-2.5-1T，攻克大模型“不可能三角”難題

時間：2026-02-14 23:19:40 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

深度思考模型領域長期面臨一個棘手難題：要在推理邏輯嚴密性、解碼速度和顯存開銷之間取得平衡幾乎不可能。若追求嚴密的推理邏輯，往往要忍受極慢的解碼速度和巨大的顯存消耗。為突破這一困境，當前業界大多采用混合專家模型（MoE）架構，通過僅激活部分參數來節省算力，像DeepSeek、Kimi、MiniMax等頭部模型均采用了該架構。

如今，螞蟻集團在這一領域取得重大進展，成功打破行業局限。該集團正式開源了全球首個基于混合線性架構的萬億參數思考模型Ring-2.5-1T，它同時實現了推理速度快、深度思考能力強、長程任務執行能力突出這三項過去難以同時達成的目標。

在多項評測中，Ring-2.5-1T表現出色。在數學競賽方面，它在國際數學奧林匹克競賽（IMO）中取得35分（滿分42分），達到金牌水平；在中國數學奧林匹克競賽（CMO）中拿到105分，遠超國家集訓隊分數線。在長文本生成場景中，對于32K以上的長文本，它將訪存規模降至上一代的十分之一，生成吞吐量提升超過3倍，在搜索、編碼等復雜任務處理上展現出強大能力。

Ring-2.5-1T的速度優勢源于其底層架構的創新。它基于Ling 2.5架構，采用混合線性注意力機制，按照1:7的比例混合多頭潛在注意力（MLA）和Lightning Linear Attention兩種注意力模塊。這一設計借鑒了螞蟻此前發布的Ring-flash-linear-2.0技術路線。

研發團隊運用增量訓練方法，將原有架構中的分組查詢注意力（GQA）層分別轉化為Lightning Linear Attention和MLA。其中，Lightning Linear Attention負責在長程推理中提升吞吐量，MLA則極致壓縮KV Cache。為防止架構改造影響模型表達能力，團隊還適配了QK Norm和Partial RoPE等特性。經過改造，Ring-2.5-1T的激活參數量從上一代的51B提升至63B，但憑借線性時間復雜度特性，推理效率大幅提高。與同為1T參數量級、激活參數僅32B的Kimi K2架構相比，Ling 2.5架構在長序列推理任務中的吞吐優勢明顯，且隨著生成長度增加，效率優勢持續擴大。這意味著長程推理不再是高成本、高硬件要求的操作，而是可規模化部署的輕量級方案。

在思維訓練方面，Ring-2.5-1T在基于可驗證獎勵的強化學習（RLVR）基礎上引入密集獎勵機制。與傳統僅關注最終答案正確與否的方式不同，該機制會逐步考察推理過程每個環節的嚴謹性，使模型在邏輯漏洞和高階證明技巧運用上有顯著提升。團隊還引入大規模全異步Agentic RL訓練，大幅增強模型在搜索、編碼等長鏈條任務上的自主執行能力，讓模型從單純的數學證明高手轉變為能在復雜實戰場景中獨當一面的智能體。

螞蟻研究團隊將Ring-2.5-1T與多個開源模型和閉源API進行對比，包括DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking、GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking等。結果顯示，在高難度推理任務如IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench，以及長時任務執行基準如Gaia2-search、Tau2-bench、SWE-Bench Verified上，Ring-2.5-1T均達到開源最優水平。在Heavy Thinking模式下，它在多項數學競賽和代碼生成基準中超越所有對比模型，包括上述閉源API。特別是在IMO 2025中拿到35分達到金牌水平，在CMO 2025中獲得105分，大幅超過金牌線78分和國家集訓隊選拔線87分。與上一代Ring-1T相比，新模型在推理邏輯嚴謹性、高級證明技巧運用和答案表述完整性上都有明顯進步。

在生態適配與開源落地方面，Ring-2.5-1T已適配Claude Code和OpenClaw等主流智能體框架，支持多步規劃與工具調用。模型權重與推理代碼已在Hugging Face、ModelScope等平臺同步開放，官方Chat體驗頁和API服務也即將上線。

除Ring-2.5-1T外，螞蟻集團同期還發布了擴散語言模型LLaDA2.1和全模態大模型Ming-flash-omni-2.0。LLaDA2.1采用非自回歸并行解碼技術，推理速度達535 tokens/s，在Humaneval+編程任務上甚至達到892 tokens/s，還具備獨特的Token編輯與逆向推理能力。Ming-flash-omni-2.0在視覺、音頻、文本的統一表征與生成上取得突破，打通多模態感知與創作能力，支持實時感官交互。螞蟻相關團隊計劃將這些能力做成可復用的底座方案，為開發者提供統一的能力入口，后續還將在視頻時序理解、復雜圖像編輯和長音頻實時生成等方向持續發力，推動全模態技術規模化落地。

隨著AI大模型應用場景從短對話向長文檔處理、跨文件代碼理解、復雜任務規劃等方向延伸，深度思考模型的效率瓶頸愈發突出。Ring-2.5-1T通過重構底層架構，為兼顧性能、成本與擴展性提供了技術路徑。

更多>同類資訊

北航團隊新突破：神經形態視覺系統或讓機器人反應速度比肩人類

02-14

AI投資新視角：服務業敞口成關鍵，“AI基建”或成避風港與增長極

02-14

宇樹科技王興興：具身智能尚處粗獷時代，未來突破熱度或超移動互聯網

02-14

春運新景：AI機器人“各顯神通” 助力旅客出行與鐵路安全保障

02-14

GigaBrain-0.5M*問世：世界模型賦能機器人，開啟“先思后行”智能新篇

02-14

西湖大學新成果：AI推理模型數據“特殊印記”檢測技術問世

02-14

eBay新突破：AI“進化”成電商專家，精準解鎖商品信息新奧秘

02-14

港大新成果：VR賦能機器人，開啟類人動作學習全新篇章

02-14

港大創新SparseVideoNav技術：賦予機器人“預見力”實現超視野尋路

02-14

哈佛等攜手OpenAI：AI助力揭開膠子散射“隱秘角落”新奧秘

02-14

MIT與Adobe聯合研發AI系統：一鍵生成多樂器完美合奏，開啟音樂創作新紀元

02-14

加拿大團隊突破微制造瓶頸：近場聲打印技術讓柔性材料3D打印精度飆升

02-14

從講臺到車燈帝國：常州女首富周曉萍的創業路與年入130億傳奇

02-14

方向盤握在手中：春節歸途里中國人探索出的團圓新可能

02-14

英偉達HBM4初期供應商鎖定：SK海力士、三星電子領跑美光暫未達標

02-14

點擊查看更多 +

全站最新

比亞迪新春機場廣告暖心上線：以溫情陪伴共赴團圓之約

2026款凱翼昆侖新增4款車型上市，11.99萬起，5座7座可選性價比高

奔馳AMG GT SUV量產版諜照曝光！三電機加持，性能續航表現亮眼

勞斯萊斯幻影定制版閃耀登場激光雕刻引擎蓋開啟奢華汽車新境界

從人機共駕到無人之境：探索汽車智駕ADAS系統的進化與未來之路

55歲李靜勇敢公開更年期經歷：停經不羞恥，展現女性真實力量

熱門內容

本欄最新

佟歐福全球財報會首秀定調在華戰略奔馳加速本土化三年推超40款新車

南方電網多舉措應對春運：建充電站增供給保出行暢無憂

長馳汽車海外訂單火爆：借產業集群東風智能化升級拓新程

上汽集團子公司設25億私募基金，聚焦固態電池等前沿技術布局未來

螞蟻開源全球首個萬億參數混合線性思考模型性能躍升達IMO金牌水準

馬年汽車業新征程：以“和光同塵”之姿破局前行謀發展

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

螞蟻集團發布萬億參數思考模型Ring-2.5-1T，攻克大模型“不可能三角”難題

螞蟻集團發布萬億參數思考模型Ring-2.5-1T，攻克大模型“不可能三角”難題