滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

螞蟻集團開源Ming-flash-omni 2.0：全模態能力升級，為多模態應用開發提供新引擎

時間：2026-02-11 12:21:56 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

螞蟻集團近日宣布，其自主研發的全模態大模型Ming-flash-omni 2.0正式開源，為全球開發者提供了一套支持多模態交互的通用能力框架。該模型在視覺語言理解、語音生成控制及圖像編輯等領域的多項基準測試中表現優異，部分指標甚至超越了專用模型，標志著全模態技術向實用化邁出關鍵一步。

作為業界首個實現音頻全場景統一生成的模型，Ming-flash-omni 2.0突破了傳統語音合成與音效處理的界限。通過自然語言指令，用戶可同時操控語音、環境音效及背景音樂的生成，并精準調節音色、語速、語調等12項參數。模型在推理效率上達到3.1Hz的幀率，支持分鐘級長音頻的實時高保真輸出，其零樣本音色克隆技術更實現了無需訓練即可復現特定聲音的能力。

技術團隊透露，該模型基于Ling-2.0架構（MoE，100B-A6B）構建，通過系統性優化實現了三大核心突破：視覺模塊整合億級細粒度數據，顯著提升對復雜物體的識別精度；音頻模塊突破多軌生成限制，實現三要素同步合成；圖像模塊增強編輯穩定性，支持光影動態調整、場景智能替換等高級功能。在文物鑒定、工業檢測等場景中，模型對細微特征的識別準確率較前代提升37%。

全模態技術的核心挑戰在于平衡通用性與專業性。螞蟻集團通過分階段演進策略破解這一難題：早期版本構建多模態基礎能力，中期版本驗證規模效應，2.0版本則通過10倍級數據擴容與混合專家訓練法，在保持開源模型開放性的同時，使文本生成、圖像理解等任務達到行業頂尖水平。實測數據顯示，其語音合成質量在MOS評分中達到4.8分（滿分5分），接近人類發音水平。

開源社區已同步上線模型權重與推理代碼，開發者可通過Hugging Face平臺直接調用。螞蟻百靈官方平臺Ling Studio更提供在線體驗入口，用戶上傳圖片或音頻后，可實時測試模型的人物姿態優化、一鍵修圖、情緒語音生成等功能。某影視后期團隊測試后表示，該模型將傳統多軟件協作的流程壓縮至單一框架內，工作效率提升60%以上。

項目負責人指出，全模態架構的價值在于消除不同模態間的調用壁壘。通過統一的能力底座，開發者可避免重復訓練視覺、語音等基礎模塊，大幅降低AI應用的開發成本。目前團隊正攻關視頻時序理解與長音頻實時生成技術，未來計劃完善工具鏈生態，推動全模態技術在智慧醫療、數字內容生產等領域的規模化落地。

02-11

AI讓你更高效，為什么你卻感覺更忙了？

02-11

OpenAI更新ChatGPT深度研究工具

02-11

黑石增持Anthropic股份至10億美元，公司估值3500億美元

02-11

OpenAI升級Responses API

02-11

央視財經攜手天眼查：用大數據解碼中國經濟活力密碼

02-11

OpenAI更新ChatGPT深度研究工具：GPT-5.2驅動，新增全屏查看器等功能

02-11

車險中介天塌了！ChatGPT 上線“比價神器”：1.9 億條數據加持，保費透明時代來了

02-11

免費可用:DuckDuckGo AI 語音聊天上線，承諾不存儲音頻

02-11

智譜 GLM-5 意外“泄露”？復用 DeepSeek 架構性能炸裂，市值狂飆 200% 坐穩國產 AI 頂流

02-11

機器人進化“奇點”已至？原力靈機發布全球首個具身原生大模型 DM0：不僅全面開源，更要讓機器人“自學成才”

02-11

保單中介天塌了!ChatGPT 首款保險應用上線，WTW 股價創18年最大跌幅

02-11

技術筑基市場拓局綠的諧波借人形機器人東風駛向增長新航道

02-11

央視財經聯袂天眼查：以數據為鑰解鎖中國經濟活力新圖景

02-11

DuckDuckGo AI語音聊天功能上線，隱私保護升級，免費開放體驗

02-11

點擊查看更多 +

全站最新

豐田逆勢布局美國純電市場 2027款電動漢蘭達續航超515公里年底上市

新款騰勢Z9GT內飾官圖亮相：碳纖維點綴+運動座椅，續航能力顯著提升

中國1月核心CPI環比上漲0.3%，為近6個月最高

中國1月PPI環比繼續上漲同比降幅收窄

港股異動丨上海小南國盤初再跌20%，旗下10間餐廳暫停營運

A股異動丨主流產品價格整體上行！稀土股集體走強，北方稀土、銀河磁體漲超6%

熱門內容

本欄最新

長城魏牌V9X來襲！近5米3大身軀，2.0T插混續航超千公里，實力幾何？

央視聚焦東風汽車：以創新智造引領，驅動中國汽車產業穩健邁向新征程

閔行新春沙龍：網絡創作者共探優質內容創作，共繪閔行發展新畫卷

理想汽車新突破：全新L9馬赫100雙芯片有效算力遠超英偉達Thor U

問界星光之夜余承東解讀品牌命名，大模型AI將升級老車主，銷量目標再沖刺

長城補齊產品短板！魏牌V9X官圖曝光，攜新技術入局綠牌全尺寸SUV賽道

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

螞蟻集團開源Ming-flash-omni 2.0：全模態能力升級，為多模態應用開發提供新引擎