岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

螞蟻集團發布萬億參數思考模型Ring-2.5-1T,攻克大模型“不可能三角”難題

   時間:2026-02-14 23:19:40 來源:互聯網編輯:快訊 IP:北京 發表評論無障礙通道
 

深度思考模型領域長期面臨一個棘手難題:要在推理邏輯嚴密性、解碼速度和顯存開銷之間取得平衡幾乎不可能。若追求嚴密的推理邏輯,往往要忍受極慢的解碼速度和巨大的顯存消耗。為突破這一困境,當前業界大多采用混合專家模型(MoE)架構,通過僅激活部分參數來節省算力,像DeepSeek、Kimi、MiniMax等頭部模型均采用了該架構。

如今,螞蟻集團在這一領域取得重大進展,成功打破行業局限。該集團正式開源了全球首個基于混合線性架構的萬億參數思考模型Ring-2.5-1T,它同時實現了推理速度快、深度思考能力強、長程任務執行能力突出這三項過去難以同時達成的目標。

在多項評測中,Ring-2.5-1T表現出色。在數學競賽方面,它在國際數學奧林匹克競賽(IMO)中取得35分(滿分42分),達到金牌水平;在中國數學奧林匹克競賽(CMO)中拿到105分,遠超國家集訓隊分數線。在長文本生成場景中,對于32K以上的長文本,它將訪存規模降至上一代的十分之一,生成吞吐量提升超過3倍,在搜索、編碼等復雜任務處理上展現出強大能力。

Ring-2.5-1T的速度優勢源于其底層架構的創新。它基于Ling 2.5架構,采用混合線性注意力機制,按照1:7的比例混合多頭潛在注意力(MLA)和Lightning Linear Attention兩種注意力模塊。這一設計借鑒了螞蟻此前發布的Ring-flash-linear-2.0技術路線。

研發團隊運用增量訓練方法,將原有架構中的分組查詢注意力(GQA)層分別轉化為Lightning Linear Attention和MLA。其中,Lightning Linear Attention負責在長程推理中提升吞吐量,MLA則極致壓縮KV Cache。為防止架構改造影響模型表達能力,團隊還適配了QK Norm和Partial RoPE等特性。經過改造,Ring-2.5-1T的激活參數量從上一代的51B提升至63B,但憑借線性時間復雜度特性,推理效率大幅提高。與同為1T參數量級、激活參數僅32B的Kimi K2架構相比,Ling 2.5架構在長序列推理任務中的吞吐優勢明顯,且隨著生成長度增加,效率優勢持續擴大。這意味著長程推理不再是高成本、高硬件要求的操作,而是可規模化部署的輕量級方案。

在思維訓練方面,Ring-2.5-1T在基于可驗證獎勵的強化學習(RLVR)基礎上引入密集獎勵機制。與傳統僅關注最終答案正確與否的方式不同,該機制會逐步考察推理過程每個環節的嚴謹性,使模型在邏輯漏洞和高階證明技巧運用上有顯著提升。團隊還引入大規模全異步Agentic RL訓練,大幅增強模型在搜索、編碼等長鏈條任務上的自主執行能力,讓模型從單純的數學證明高手轉變為能在復雜實戰場景中獨當一面的智能體。

螞蟻研究團隊將Ring-2.5-1T與多個開源模型和閉源API進行對比,包括DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking、GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking等。結果顯示,在高難度推理任務如IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench,以及長時任務執行基準如Gaia2-search、Tau2-bench、SWE-Bench Verified上,Ring-2.5-1T均達到開源最優水平。在Heavy Thinking模式下,它在多項數學競賽和代碼生成基準中超越所有對比模型,包括上述閉源API。特別是在IMO 2025中拿到35分達到金牌水平,在CMO 2025中獲得105分,大幅超過金牌線78分和國家集訓隊選拔線87分。與上一代Ring-1T相比,新模型在推理邏輯嚴謹性、高級證明技巧運用和答案表述完整性上都有明顯進步。

在生態適配與開源落地方面,Ring-2.5-1T已適配Claude Code和OpenClaw等主流智能體框架,支持多步規劃與工具調用。模型權重與推理代碼已在Hugging Face、ModelScope等平臺同步開放,官方Chat體驗頁和API服務也即將上線。

除Ring-2.5-1T外,螞蟻集團同期還發布了擴散語言模型LLaDA2.1和全模態大模型Ming-flash-omni-2.0。LLaDA2.1采用非自回歸并行解碼技術,推理速度達535 tokens/s,在Humaneval+編程任務上甚至達到892 tokens/s,還具備獨特的Token編輯與逆向推理能力。Ming-flash-omni-2.0在視覺、音頻、文本的統一表征與生成上取得突破,打通多模態感知與創作能力,支持實時感官交互。螞蟻相關團隊計劃將這些能力做成可復用的底座方案,為開發者提供統一的能力入口,后續還將在視頻時序理解、復雜圖像編輯和長音頻實時生成等方向持續發力,推動全模態技術規模化落地。

隨著AI大模型應用場景從短對話向長文檔處理、跨文件代碼理解、復雜任務規劃等方向延伸,深度思考模型的效率瓶頸愈發突出。Ring-2.5-1T通過重構底層架構,為兼顧性能、成本與擴展性提供了技術路徑。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 精品久久久久一区二区国产 | 成人黄色片网站 | 免费av福利 | 极品少妇xxxx精品少妇偷拍 | 国产男女无套免费网站 | 男人天堂中文字幕 | 欧美性猛交xxxx免费看 | jzzijzzij日本成熟少妇 | 天堂av一区二区 | 亚洲视频第一页 | 激情国产在线 | 精品日韩在线观看 | 欧美精品综合 | 午夜免费观看 | 国产精品视频免费观看 | 久久在线精品视频 | 毛片在线免费观看视频 | 国产小视频网站 | 午夜久久久久久久久久影院 | 亚洲性天堂| 亚洲色图清纯唯美 | 欧美三级视频在线 | 亚洲男人的天堂在线观看 | 一区二区三区四区免费观看 | 亚洲综合在线观看视频 | 欧美亚洲专区 | 欧美大片在线看免费观看 | 国产精品中文字幕在线 | 天天干免费视频 | 一级黄色片a | 久久88| 2020自拍偷拍 | 欧美嫩草 | 国产对白在线播放 | 午夜不卡影院 | 一级特黄色大片 | 成人免费视频国产免费麻豆 | 日韩资源在线观看 | 黄色在线免费视频 | 国产精品影院在线观看 | 欧美激情福利 |