岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

螞蟻開源全球首個萬億參數混合線性思考模型 性能躍升達IMO金牌水準

   時間:2026-02-14 03:30:50 來源:天脈網編輯:快訊 IP:北京 發表評論無障礙通道
 

螞蟻集團近日宣布開源全球首個基于混合線性架構的萬億參數思考模型Ring-2.5-1T,標志著AI大模型領域在長文本處理與復雜任務規劃能力上取得突破性進展。該模型在生成效率、推理深度和長時程任務執行能力三大核心指標上實現顯著提升,尤其在數學競賽、代碼生成和智能體任務執行等場景中展現出開源模型領先水平。

在數學推理能力驗證中,Ring-2.5-1T在國際數學奧林匹克競賽(IMO 2025)自測中取得35分(滿分42分),中國數學奧林匹克(CMO 2025)自測中更以105分遠超金牌線78分和國家隊集訓隊選拔線87分。對比前代模型Ring-1T,新模型在推理邏輯嚴謹性、高級數學證明技術應用和答案完整性方面均有顯著優化。在編程能力測試中,該模型在LiveCodeBench-v6代碼生成基準中超越所有對比模型,展現出強大的工程化落地潛力。

技術架構層面,Ring-2.5-1T基于創新的Ling 2.5混合線性注意力架構,通過將傳統GQA(分組查詢注意力)升級為MLA(多頭線性注意力)與Lightning Linear結構的1:7混合比例,在保持63B激活參數規模的同時,將內存訪問開銷降低至前代的1/10。實驗數據顯示,在32K以上長文本生成場景中,模型生成吞吐量提升超3倍,且隨著序列長度增加,效率優勢持續擴大。在配備8塊H200 GPU的測試環境中,當生成長度超過16K tokens時,其解碼吞吐量較傳統架構模型高出40%以上。

針對復雜任務執行場景,研究人員通過大規模完全異步智能體強化學習訓練,使模型具備跨應用工具協作能力。在智能體搜索任務Gaia2-search中,Ring-2.5-1T在規劃生成和多步工具調用準確率上達到開源模型最優水平,較Kimi-K2.5-Thinking等競品提升23%。該模型已實現與Claude Code智能體編程框架和OpenClaw個人AI助手的快速適配,支持多步驟工具調用與動態規劃生成。

在開源生態建設方面,螞蟻集團同步在Hugging Face、ModelScope等平臺發布模型權重與推理代碼,并計劃于近期上線官方Chat體驗頁和API服務。對比測試顯示,在AIME 26數學推理、HMMT 25競賽數學等高難度基準測試中,Ring-2.5-1T均實現開源模型最佳性能,在SWE-Bench Verified軟件工程任務執行基準中更以87.6%的通過率領先第二名14個百分點。這些突破為金融、科研、工業等領域處理超長文檔、復雜業務流程提供了新的技術路徑。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 成年人在线免费看 | 九九九视频在线观看 | 久久网国产 | 在线观看免费福利 | 欧美高清一区 | 亚洲天堂精品在线观看 | 国产99久久久 | 日本精品999| 91在线小视频 | 一区二区蜜桃 | 亚洲在线视频一区二区 | 国产精品一区av | www.黄色国产 | 麻豆91在线观看 | 亚洲不卡一区二区三区 | 91精品亚洲 | 黄色成年视频 | 中文字幕1| 成人综合色站 | 蜜桃精品视频在线观看 | 日韩91在线| 国产日产精品一区二区三区 | www.黄在线观看 | 久热国产在线 | 视频成人| 久久久看片 | 91精品视频网站 | 免费在线中文字幕 | 黄色av网址在线 | 欧美日韩综合 | 一级黄色免费毛片 | 成人av片在线观看 | 天堂av免费看 | 久久中字 | 蜜臀久久99精品久久久久久宅男 | 日韩精品欧美精品 | 二区三区在线 | 综合中文字幕 | 四虎影院永久地址 | 98av视频 | 国产999|