滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

螞蟻集團開源全模態大模型Ming-Flash-Omni 2.0 推動多模態技術深度融合與應用

時間：2026-02-11 11:54:26 來源：ITBEAR編輯：快訊 IP：北京 發表評論無障礙通道

螞蟻集團近日宣布開源其最新研發的全模態大模型——Ming-Flash-Omni 2.0。該模型在視覺語言理解、語音可控生成、圖像生成與編輯等多個領域展現出卓越性能，成為開源社區中備受矚目的技術突破。

作為業界首個全場景音頻統一生成模型，Ming-Flash-Omni 2.0突破了傳統模型在音頻處理上的局限。它能夠在單條音軌中同時生成語音、環境音效和音樂，并通過自然語言指令實現音色、語速、語調、音量、情緒和方言的精準控制。在推理效率方面，該模型達到3.1Hz的極低幀率，支持分鐘級長音頻的實時高保真生成，在成本控制和性能表現上均處于行業領先地位。

全模態大模型的發展面臨通用性與專精性的平衡難題。開源模型在特定任務上往往難以媲美專用模型，但螞蟻集團通過持續投入和技術迭代，使Ming-Omni系列逐步突破這一瓶頸。早期版本構建了多模態能力基礎，中期版本驗證了規模增長帶來的性能提升，而2.0版本通過更大規模的數據訓練和系統性優化，在全模態理解與生成能力上達到開源領域領先水平，甚至在部分場景超越專用模型。

該模型基于Ling-2.0架構（MoE，100B-A6B）開發，圍繞"精準識別、精細控制、穩定生成"三大核心目標進行優化。在視覺領域，通過融合億級細粒度數據和難例訓練策略，顯著提升了對近緣物種、工藝細節和稀有文物的識別能力；音頻方面，支持語音、音效、音樂的同軌生成，并具備零樣本音色克隆功能；圖像編輯功能則強化了復雜場景的穩定性，支持光影調整、場景替換和一鍵修圖等操作，即使在動態場景中也能保持畫面連貫性。

百靈模型負責人周俊指出，全模態技術的核心在于通過統一架構實現多模態能力的深度融合。開源后，開發者可基于同一框架調用視覺、語音和生成能力，大幅降低多模型串聯的復雜度和開發成本。目前，Ming-Flash-Omni 2.0的模型權重和推理代碼已在Hugging Face等開源平臺發布，用戶也可通過螞蟻百靈官方平臺Ling Studio進行在線體驗和調用。

這一技術突破不僅為端到端多模態應用開發提供了統一能力入口，更推動了AI技術在實際業務中的規模化落地。隨著工具鏈和評測體系的不斷完善，全模態大模型有望在更多領域展現其變革性潛力。

更多>同類資訊

AI讓你更高效，為什么你卻感覺更忙了？

02-11

OpenAI更新ChatGPT深度研究工具

02-11

黑石增持Anthropic股份至10億美元，公司估值3500億美元

02-11

OpenAI升級Responses API

02-11

央視財經攜手天眼查：用大數據解碼中國經濟活力密碼

02-11

OpenAI更新ChatGPT深度研究工具：GPT-5.2驅動，新增全屏查看器等功能

02-11

車險中介天塌了！ChatGPT 上線“比價神器”：1.9 億條數據加持，保費透明時代來了

02-11

免費可用:DuckDuckGo AI 語音聊天上線，承諾不存儲音頻

02-11

智譜 GLM-5 意外“泄露”？復用 DeepSeek 架構性能炸裂，市值狂飆 200% 坐穩國產 AI 頂流

02-11

機器人進化“奇點”已至？原力靈機發布全球首個具身原生大模型 DM0：不僅全面開源，更要讓機器人“自學成才”

02-11

保單中介天塌了!ChatGPT 首款保險應用上線，WTW 股價創18年最大跌幅

02-11

技術筑基市場拓局綠的諧波借人形機器人東風駛向增長新航道

02-11

央視財經聯袂天眼查：以數據為鑰解鎖中國經濟活力新圖景

02-11

DuckDuckGo AI語音聊天功能上線，隱私保護升級，免費開放體驗

02-11

AI代理浪潮下“互聯網門神”崛起：Cloudflare Q4營收勁增34% 前景可期

02-11

點擊查看更多 +

全站最新

中國1月核心CPI環比上漲0.3%，為近6個月最高

中國1月PPI環比繼續上漲同比降幅收窄

港股異動丨上海小南國盤初再跌20%，旗下10間餐廳暫停營運

A股異動丨主流產品價格整體上行！稀土股集體走強，北方稀土、銀河磁體漲超6%

AIGC概念股回調，新華網、粵傳媒、引力傳媒跌超8%

運滿滿：科技助力新春貨運高峰

熱門內容

本欄最新

長城魏牌V9X來襲！近5米3大身軀，2.0T插混續航超千公里，實力幾何？

央視聚焦東風汽車：以創新智造引領，驅動中國汽車產業穩健邁向新征程

閔行新春沙龍：網絡創作者共探優質內容創作，共繪閔行發展新畫卷

理想汽車新突破：全新L9馬赫100雙芯片有效算力遠超英偉達Thor U

問界星光之夜余承東解讀品牌命名，大模型AI將升級老車主，銷量目標再沖刺

長城補齊產品短板！魏牌V9X官圖曝光，攜新技術入局綠牌全尺寸SUV賽道

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

螞蟻集團開源全模態大模型Ming-Flash-Omni 2.0 推動多模態技術深度融合與應用