岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

螞蟻開源Ming-Flash-Omni 2.0：全模態突破，多項能力領先成新標桿

時間：2026-02-11 15:21:47 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

螞蟻集團近日正式開源了新一代全模態大模型Ming-Flash-Omni 2.0，該模型在視覺語言理解、語音可控生成及圖像編輯等核心領域展現出卓越性能，部分指標已超越國際主流模型Gemini 2.5 Pro，為開源社區樹立了全模態技術的新標桿。

作為業界首個實現全場景音頻統一生成的模型，Ming-Flash-Omni 2.0突破了傳統音頻處理的局限，可在單條音軌中同步生成語音、環境音效與背景音樂。用戶通過自然語言指令即可精準調控音色、語速、語調、音量及情緒參數，甚至支持方言定制與零樣本音色克隆，為影視配音、游戲音效等場景提供了高效解決方案。

在推理效率方面，該模型實現了3.1Hz的極低幀率，支持分鐘級長音頻的實時高保真生成，同時將計算成本控制在行業領先水平。這一突破得益于其基于Ling-2.0架構（MoE，100B-A6B）的優化設計，通過混合專家模型與億級數據訓練，在視覺、音頻、圖像三大模態上實現了系統性提升。

視覺領域，模型通過融合細粒度數據與難例訓練策略，顯著增強了對近緣物種、工藝細節及稀有文物的識別能力。圖像編輯功能則支持光影調整、場景替換、人物姿態優化等復雜操作，即使在動態場景中也能保持畫面連貫性與細節真實性，為專業設計提供了強大工具。

音頻生成方面，除同軌合成技術外，模型還具備自然語言驅動的精細控制能力，可實時調整語音情感表達與音效層次。圖像生成模塊則通過增強穩定性算法，使一鍵修圖、背景替換等功能更加可靠，降低了專業內容創作的門檻。

目前，Ming-Flash-Omni 2.0的模型權重與推理代碼已在Hugging Face等開源平臺全面開放，開發者可通過螞蟻百靈官方平臺Ling Studio進行在線體驗與調用。此次開源標志著螞蟻集團將多年積累的全模態技術以可復用底座的形式對外釋放，為端到端多模態應用開發提供了統一的能力入口。

據悉，Ming-Omni系列模型已歷經三次迭代，此次升級圍繞"精準識別、細膩感知、穩定生成"三大目標展開，通過架構創新與數據工程結合，在復雜場景下的多模態交互能力上取得關鍵突破，為AI技術在內容創作、智能交互等領域的應用開辟了新路徑。

更多>同類資訊

鄒平市檢察院座談：共探AI賦能刑事檢察助力辦案質效提升

2月6日，“人工智能賦能刑事檢察高質效辦案”座談會在鄒平市檢察院成功召開。會上，重點展示了由鄒平市檢察院自主研發的“案易”檢察智能化系統，通過視頻介紹、系統演示與一線干警經驗分享，全面呈現其在文書生成、證…

02-11

DuckDuckGo AI語音聊天功能上線隱私優先架構讓用戶暢聊無擔憂

IT之家 2 月 11 日消息，DuckDuckGo 昨日（2 月 10 日）發布公告，宣布其 AI 聊天機器人平臺Duck.ai新增實時語音聊天功能，主打極致隱私保護。臨時處理：音頻流僅在說話時傳輸，…

02-11

杭州以勒：以智能制造為翼開啟咖啡機源頭工廠的產業升級新征程

作為咖啡機產業鏈中的重要源頭工廠之一，位于杭州的以勒咖啡機及其關聯制造體系，正通過其扎實的工業基礎和持續的技術演進，為我們提供了一個觀察智能制造如何深度融入傳統設備制造的生動樣本。這種將物聯網、數據分析與硬件…

02-11

北斗三號NTP校時服務器：以精準時序賦能工業自動化升級之路

星間鏈路：衛星之間可以互相通信、校時，即使與地面站暫時失去聯系，也能自主維持系統時間的高精度。云邊端協同：在工業互聯網云平臺中，北斗時間將成為貫穿云、邊、端所有數據與操作的唯一可信時序基準。總結來說，北…

02-11

智慧供水監測：以科技之力賦能供水行業，開啟精細化管理新篇章

智慧供水監測系統的落地讓供水管網數字化管理水平顯著提升，水質異常實時預警為飲用水安全筑牢防線，管網壓力與流量的動態監測，能精準捕捉運行問題，避免管網破損與供水壓力不足等情況，同時及時發現漏損問題降低水資源無…

02-11

三星2月26日將發S26系列三款新機！AI升級、影像提升亮點滿滿

三星邀請函以“AI”為主題，暗示S26系列將在AI功能上有重大升級。S26Ultra則配備6.8英寸微曲屏，內置5000mAh電池，支持最高45W有線快充和25W無線充電。三星S26系列的最大亮點在于AI…

02-11

三星2月26日發布S26系列新機！三款機型齊亮相，AI功能成最大亮點

02-11

晶存科技以創新驅動高性能存儲發展，2026年拓展全球市場再啟新程

可以預見的是，隨著AI、智能汽車等前沿應用在全球范圍內爆發，其對高端存儲芯片的需求正創造出一個巨大的全球性市場，晶存科技將緊抓機遇，在全球存儲市場上更進一步，持續突破與迭代存儲產品平臺，滿足多樣化客戶綜合需求…

02-11

車險行業迎變革！ChatGPT“比價神器”上線，海量數據助力保費透明化

02-11

智譜GLM-5“身份”揭曉：復用DeepSeek架構參數翻倍，市值飆升坐實國產AI領跑者

02-11

具身原生大模型DM0問世：原力靈機以開源之力，推動機器人邁向“自學”新紀元

02-11

隆利科技越南工廠投產海康威視武漢科技園啟用共拓LED應用新篇

02-11

物件會“說話”：從宇通年會故事里探尋企業創新發展密碼

02-11

OpenAI升級ChatGPT深度研究工具：GPT-5.2賦能新增全屏查看器等多項實用功能

02-11

螞蟻集團開源Ming-flash-omni 2.0：全模態能力升級，為多模態應用開發提供新引擎

02-11

點擊查看更多 +

全站最新

澳股收漲1.66%，創去年10月以來新高

A股數字貨幣股走強，香港計劃下個月發放穩定幣牌照

雷軍官宣初代小米SU7停產：上市兩年交付超38.1萬輛純電轎跑新標桿落幕

臺股收盤再創歷史新高，年內累漲16.03%

A股黃金概念股走強，山東黃金漲超4%

麥格理：首予文遠知行"跑贏大市"評級，目標價46港元/17.5美元

熱門內容

本欄最新

長城魏牌V9X來襲！近5米3大身軀，2.0T插混續航超千公里，實力幾何？

央視聚焦東風汽車：以創新智造引領，驅動中國汽車產業穩健邁向新征程

閔行新春沙龍：網絡創作者共探優質內容創作，共繪閔行發展新畫卷

理想汽車新突破：全新L9馬赫100雙芯片有效算力遠超英偉達Thor U

問界星光之夜余承東解讀品牌命名，大模型AI將升級老車主，銷量目標再沖刺

長城補齊產品短板！魏牌V9X官圖曝光，攜新技術入局綠牌全尺寸SUV賽道

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.