滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

螞蟻開源Ming-Flash-Omni 2.0：全模態大模型多項能力領先，賦能多場景應用

時間：2026-02-12 05:52:16 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

螞蟻集團近日宣布開源其最新研發的全模態大模型 Ming-Flash-Omni 2.0，該模型在視覺語言理解、語音可控生成及圖像編輯等多個領域展現出卓越性能，部分指標甚至超越了國際頂尖的 Gemini 2.5 Pro，為開源社區樹立了新的性能標桿。

作為業界首個全場景音頻統一生成模型，Ming-Flash-Omni 2.0 突破了傳統模型的局限，能夠在同一條音軌中同時生成語音、環境音效與音樂，實現了音頻生成領域的重大創新。用戶只需通過自然語言指令，即可對音色、語速、語調、音量、情緒及方言等參數進行精細調控，滿足多樣化的音頻創作需求。該模型在推理階段達到了 3.1Hz 的極低幀率，支持分鐘級長音頻的實時高保真生成，在推理效率與成本控制方面均處于行業領先地位。

多模態大模型的發展趨勢是走向更統一的架構，以實現不同模態與任務之間的深層協同。然而，現有的“全模態”模型往往難以兼顧通用性與專精性，在特定單項能力上，開源模型通常不及專用模型。螞蟻集團在全模態領域深耕多年，Ming-Omni 系列模型在此背景下持續迭代升級。早期版本構建了統一的多模態能力基礎，中期版本驗證了規模增長對能力提升的作用，而最新發布的 2.0 版本則通過更大規模的數據與系統性訓練優化，將全模態理解與生成能力提升至開源領先水平，并在部分領域超越了頂級專用模型。

Ming-Flash-Omni 2.0 的開源，意味著其核心能力將以“可復用底座”的形式向外界開放，為端到端多模態應用開發提供統一的能力入口。這一舉措將顯著降低開發者在多模型串聯方面的復雜度與成本，推動全模態技術的廣泛應用。

該模型基于 Ling-2.0 架構（MoE，100B-A6B）進行訓練，圍繞“看得更準、聽得更細、生成更穩”三大目標進行了全面優化。在視覺方面，通過融合億級細粒度數據與難例訓練策略，模型顯著提升了對近緣動植物、工藝細節及稀有文物等復雜對象的識別能力；在音頻方面，實現了語音、音效、音樂的同軌生成，支持自然語言對音色、語速、情緒等參數的精細控制，并具備零樣本音色克隆與定制能力；在圖像方面，增強了復雜編輯的穩定性，支持光影調整、場景替換、人物姿態優化及一鍵修圖等功能，即使在動態場景中也能保持畫面連貫與細節真實。

百靈模型負責人周俊指出，全模態技術的核心在于通過統一架構實現多模態能力的深度融合與高效調用。開源后，開發者可以基于同一套框架復用視覺、語音與生成能力，從而大幅降低開發成本與復雜度。目前，Ming-Flash-Omni 2.0 的模型權重與推理代碼已在 Hugging Face 等開源社區發布，用戶也可通過螞蟻百靈官方平臺 Ling Studio 在線體驗與調用該模型。

更多>同類資訊

SK海力士發布最快LPDDR6內存模塊三星加速追趕布局高端存儲市場

快科技2月12日消息，據媒體報道，SK海力士近期公布了其新一代LPDDR6內存模塊的規格。該模塊基于1cnm DRAM制造工藝，單顆容量為16Gb，傳輸速率達到14.4Gbps，已觸及現階段JEDEC標準上…

02-12

先一科技新能源場站方案：構建無人值班體系，推動智慧化轉型與效益提升

02-12

千問奶茶活動、螞蟻阿福“健康福” 雙雙助力登頂蘋果應用總榜前二

02-12

中國科技館春節“馬”主題展：揭秘馬趣事展現古今科技融合魅力

02-12

2025消費市場新圖景：6大核心賽道潛力洞察與增長密碼解鎖

02-12

曹操出行Robotaxi車隊規模已達100輛

02-12

螞蟻開源Ming-Flash-Omni 2.0：全模態大模型性能領先，開啟多模態應用新篇

螞蟻集團在全模態方向已持續投入多年，Ming-Omni系列正是在這一背景下持續演進：早期版本構建統一多模態能力底座，中期版本驗證規模增長帶來的能力提升，而最新2.0版本通過更大規模數據與系統性訓練優化，將全模…

02-12

螞蟻集團開源全模態大模型Ming-Flash-Omni 2.0，多領域能力領先且支持在線體驗

螞蟻集團在全模態方向已持續投入多年，Ming-Omni系列正是在這一背景下持續演進：早期版本構建統一多模態能力底座，中期版本驗證規模增長帶來的能力提升，而最新 2.0 版本通過更大規模數據與系統性訓練優化，…

02-12

清華聯合多方發力：AI訓練數據分層管理開啟智能訓練新范式

02-12

中國電科再傳捷報：兩款新型芯片流片成功助力自主算力體系構建

02-12

DeepSeek最新模型開啟灰度測試：上下文處理能力躍升至1M

02-12

北京首家機器人綜合體落地陶朱新造局，構建全周期服務助力場景爆發

02-12

中國電科14所華創微：高性能處理器與AI芯片流片測試成功助力邊緣計算

02-12

加密貨幣震蕩中逆勢而動：億萬富豪Val Vavilov低位增持比特幣謀新局

02-12

趣丸科技攜AI技術與虛擬偶像亮相2026網絡視聽盛典開啟數藝融合新篇章

02-12

點擊查看更多 +

全站最新

蔣大為2026馬年獻聲《回家過年》溫潤嗓音唱響團圓喚醒游子歸鄉情

廣汽集團2025年報：科技轉型加速，前沿成果引領未來增長新機遇

問界M9星光之夜：精英圈層共鑒，科技豪華引領品牌與用戶攜手前行

本田2026款CG160特別版來襲：運動新貌登場，內地版CG125能否跟上步伐？

奔馳將推全新入門級車型：2028年亮相，SUV與MPV風格融合引期待

超千匹馬力！奔馳AMG旗艦純電SUV將至，老牌豪車電動化再掀高潮

熱門內容

本欄最新

別克至境E7實車曝光，智能插混+超長續航，20萬級SUV市場新選擇

春節返鄉潮來襲，江蘇多舉措保障新能源車充電“一路暢行”

科技豪華雙驅動騰勢D9三年銷冠重塑全球高端MPV新格局

長城魏牌V9X來襲！近5米3大身軀，2.0T插混續航超千公里，實力幾何？

央視聚焦東風汽車：以創新智造引領，驅動中國汽車產業穩健邁向新征程

閔行新春沙龍：網絡創作者共探優質內容創作，共繪閔行發展新畫卷

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

螞蟻開源Ming-Flash-Omni 2.0：全模態大模型多項能力領先，賦能多場景應用