滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

螞蟻開源Ming-Flash-Omni 2.0：全模態大模型性能領先，開啟多模態應用新篇

時間：2026-02-12 02:56:46 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

螞蟻集團近日宣布開源全模態大模型Ming-Flash-Omni 2.0，該模型在視覺語言理解、語音可控生成及圖像編輯等核心領域展現出卓越性能，部分指標甚至超越國際頂尖模型Gemini 2.5 Pro，成為開源領域全模態技術的新標桿。這一成果標志著螞蟻集團在多模態人工智能領域的技術積累進入全新階段。

作為業界首個實現全場景音頻統一生成的模型，Ming-Flash-Omni 2.0突破性地將語音、環境音效與音樂融合于單一音軌。用戶通過自然語言指令即可精準調控音色、語速、語調乃至方言特征，模型更支持零樣本音色克隆技術。在效率方面，該模型以3.1Hz的推理幀率實現分鐘級長音頻的實時高保真生成，在成本控制與處理速度上達到行業領先水平。實測數據顯示，其在復雜音頻場景下的生成質量已接近專業音頻工作站標準。

技術架構層面，模型基于Ling-2.0架構（MoE，100B-A6B）構建，通過系統性訓練優化實現三大核心突破：視覺模塊采用億級細粒度數據訓練，顯著提升對近緣物種、文物細節等復雜對象的識別精度；音頻模塊突破傳統分離式生成模式，實現多要素協同創作；圖像編輯模塊強化動態場景處理能力，支持光影調整、場景替換等高級功能的同時保持畫面連貫性。這些特性使其在醫療影像分析、文化遺產數字化等場景具有廣泛應用潛力。

螞蟻集團百靈模型負責人周俊指出，全模態技術的核心價值在于通過統一架構實現多維度能力的深度融合。此次開源將模型權重與推理代碼同步釋放至Hugging Face等平臺，開發者可基于單一框架調用視覺、語音、生成等全棧能力，較傳統多模型串聯方案降低60%以上的開發成本。配套上線的Ling Studio平臺更提供可視化操作界面，用戶無需深厚技術背景即可完成復雜多模態任務。

該模型的演進路徑體現了螞蟻集團的技術戰略布局：早期版本聚焦多模態基礎能力建設，中期版本驗證規模效應，2.0版本則通過10萬小時級音頻數據與千萬級圖像數據的訓練優化，在保持通用性的同時實現專項能力突破。特別是在語音克隆領域，其僅需3秒音頻樣本即可生成高度擬真的語音，在隱私保護前提下為無障礙溝通、個性化內容創作等場景提供技術支撐。

目前，開發者可通過螞蟻百靈官方平臺直接調用模型API，或下載開源代碼進行本地化部署。這種開放策略不僅加速了技術創新迭代，更為金融、醫療、教育等垂直領域的應用開發提供了標準化解決方案。隨著工具鏈與評測體系的持續完善，全模態技術有望在智能客服、內容生產、輔助診斷等領域實現規模化落地。

螞蟻集團在全模態方向已持續投入多年，Ming-Omni系列正是在這一背景下持續演進：早期版本構建統一多模態能力底座，中期版本驗證規模增長帶來的能力提升，而最新 2.0 版本通過更大規模數據與系統性訓練優化，…

02-12

清華聯合多方發力：AI訓練數據分層管理開啟智能訓練新范式

02-12

中國電科再傳捷報：兩款新型芯片流片成功助力自主算力體系構建

02-12

DeepSeek最新模型開啟灰度測試：上下文處理能力躍升至1M

02-12

北京首家機器人綜合體落地陶朱新造局，構建全周期服務助力場景爆發

02-12

中國電科14所華創微：高性能處理器與AI芯片流片測試成功助力邊緣計算

02-12

加密貨幣震蕩中逆勢而動：億萬富豪Val Vavilov低位增持比特幣謀新局

02-12

趣丸科技攜AI技術與虛擬偶像亮相2026網絡視聽盛典開啟數藝融合新篇章

02-12

Anthropic發布2026趨勢報告：AI助力編程革命，人人皆可成開發者

02-12

從百輛車隊到全球布局：曹操出行Robotaxi如何開啟出行新未來

02-12

零下34℃挑戰成功！我國超低溫鋰電池漠河實測8小時容量超85%

02-12

曹操出行Robotaxi邁入2.0階段：百輛車隊落地杭州，全球布局加速推進

02-12

極智嘉發布全球首款倉儲通用人形機器人Gino 1 引領倉儲智能化新跨越

該產品專為倉儲作業全鏈路設計，具備倉儲揀貨、搬箱、打包、巡檢等多任務操作能力，真正實現了“一臺機器人覆蓋倉內主流人工操作場景”，引領倉儲行業實現從“移動智能化”到“操作智能化”的關鍵跨越。機器人頭部具備三目…

02-12

對話酷哇科技CTO廖文龍：AI服務機器人爆發前夜，技術突破與市場雙輪驅動

酷哇科技CTO廖文龍對筆者表示，ChatGPT及端到端AI出現后，酷哇科技看到了創造通用且有生產力價值的機器人的可能，即移動和操作能力都能通過大模型解決。廖文龍表示，WAM 2.0提供的是通用化的移動能…

02-12

極智嘉Gino1亮相：專為倉儲設計，多任務操作引領倉儲智能化新跨越

據IT之家了解，機器人頭部具備三目主視覺和前后魚眼相機，兼顧近景高精度識別和前后 360度環境感知和語義理解，為多任務復雜作業提供準確性和安全性保障。同時全關節力控，可實現與人與環境的安全作業，雙臂最大 …

02-12

點擊查看更多 +

全站最新

即夢AI關聯公司臉萌科技：被“Seedance”環繞的商業版圖解析

初代小米SU7交付超38.1萬輛收官，新一代SU7升級亮相并開啟多城展示

小米SU7交付量破38.1萬輛，新一代開啟預訂，價格配置升級有何看點？

特朗普大贊非農數據，再催美聯儲降息至“全球最低”

麥格理：首予文遠知行"跑贏大市"評級，目標價46港元/17.5美元

科大訊飛回應合作傳聞：AI語音技術多領域開花，生態構建迎新機遇與挑戰

熱門內容

本欄最新

別克至境E7實車曝光，智能插混+超長續航，20萬級SUV市場新選擇

春節返鄉潮來襲，江蘇多舉措保障新能源車充電“一路暢行”

科技豪華雙驅動騰勢D9三年銷冠重塑全球高端MPV新格局

長城魏牌V9X來襲！近5米3大身軀，2.0T插混續航超千公里，實力幾何？

央視聚焦東風汽車：以創新智造引領，驅動中國汽車產業穩健邁向新征程

閔行新春沙龍：網絡創作者共探優質內容創作，共繪閔行發展新畫卷

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

螞蟻開源Ming-Flash-Omni 2.0：全模態大模型性能領先，開啟多模態應用新篇