滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

螞蟻集團(tuán)開(kāi)源全模態(tài)大模型Ming-flash-omni 2.0 性能對(duì)標(biāo)Gemini 2.5 Pro

時(shí)間：2026-02-11 19:22:46 來(lái)源：TechWeb編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

2月11日消息，螞蟻集團(tuán)開(kāi)源發(fā)布全模態(tài)大模型Ming-flash-omni 2.0。在多項(xiàng)公開(kāi)基準(zhǔn)測(cè)試中，該模型在視覺(jué)語(yǔ)言理解、語(yǔ)音可控生成、圖像生成與編輯等關(guān)鍵能力表現(xiàn)突出。

據(jù)介紹，Ming-flash-omni 2.0是業(yè)界首個(gè)全場(chǎng)景音頻統(tǒng)一生成模型，可在同一條音軌中同時(shí)生成語(yǔ)音、環(huán)境音效與音樂(lè)。用戶只需用自然語(yǔ)言下指令，即可對(duì)音色、語(yǔ)速、語(yǔ)調(diào)、音量、情緒與方言等進(jìn)行精細(xì)控制。模型在推理階段實(shí)現(xiàn)了 3.1Hz 的極低推理幀率，實(shí)現(xiàn)了分鐘級(jí)長(zhǎng)音頻的實(shí)時(shí)高保真生成，在推理效率與成本控制上保持業(yè)界領(lǐng)先。

業(yè)內(nèi)普遍認(rèn)為，多模態(tài)大模型最終會(huì)走向更統(tǒng)一的架構(gòu)，讓不同模態(tài)與任務(wù)實(shí)現(xiàn)更深層協(xié)同。但現(xiàn)實(shí)是，“全模態(tài)”模型往往很難同時(shí)做到通用與專精：在特定單項(xiàng)能力上，開(kāi)源模型往往不及專用模型。螞蟻集團(tuán)在全模態(tài)方向已持續(xù)投入多年，Ming-Omni系列正是在這一背景下持續(xù)演進(jìn)：早期版本構(gòu)建統(tǒng)一多模態(tài)能力底座，中期版本驗(yàn)證規(guī)模增長(zhǎng)帶來(lái)的能力提升，而最新2.0版本通過(guò)更大規(guī)模數(shù)據(jù)與系統(tǒng)性訓(xùn)練優(yōu)化，將全模態(tài)理解與生成能力推至開(kāi)源領(lǐng)先水平，并在部分領(lǐng)域超越頂級(jí)專用模型。

此次將Ming-flash-omni 2.0開(kāi)源，意味著其核心能力以“可復(fù)用底座”的形式對(duì)外釋放，為端到端多模態(tài)應(yīng)用開(kāi)發(fā)提供統(tǒng)一能力入口。

Ming-flash-omni 2.0基于 Ling-2.0 架構(gòu)（MoE，100B-A6B）訓(xùn)練，圍繞“看得更準(zhǔn)、聽(tīng)得更細(xì)、生成更穩(wěn)”三大目標(biāo)全面優(yōu)化。視覺(jué)方面，融合億級(jí)細(xì)粒度數(shù)據(jù)與難例訓(xùn)練策略，顯著提升對(duì)近緣動(dòng)植物、工藝細(xì)節(jié)和稀有文物等復(fù)雜對(duì)象的識(shí)別能力；音頻方面，實(shí)現(xiàn)語(yǔ)音、音效、音樂(lè)同軌生成，支持自然語(yǔ)言精細(xì)控制音色、語(yǔ)速、情緒等參數(shù)，并具備零樣本音色克隆與定制能力；圖像方面，增強(qiáng)復(fù)雜編輯的穩(wěn)定性，支持光影調(diào)整、場(chǎng)景替換、人物姿態(tài)優(yōu)化及一鍵修圖等功能，在動(dòng)態(tài)場(chǎng)景中仍保持畫面連貫與細(xì)節(jié)真實(shí)。

百靈模型負(fù)責(zé)人周俊表示，全模態(tài)技術(shù)的關(guān)鍵在于通過(guò)統(tǒng)一架構(gòu)實(shí)現(xiàn)多模態(tài)能力的深度融合與高效調(diào)用。開(kāi)源后，開(kāi)發(fā)者可基于同一套框架復(fù)用視覺(jué)、語(yǔ)音與生成能力，顯著降低多模型串聯(lián)的復(fù)雜度與成本。未來(lái)，團(tuán)隊(duì)將持續(xù)優(yōu)化視頻時(shí)序理解、復(fù)雜圖像編輯與長(zhǎng)音頻生成實(shí)時(shí)性，完善工具鏈與評(píng)測(cè)體系，推動(dòng)全模態(tài)技術(shù)在實(shí)際業(yè)務(wù)中規(guī)模化落地。

目前，Ming-flash-omni 2.0的模型權(quán)重、推理代碼已在 Hugging Face等開(kāi)源社區(qū)發(fā)布。用戶也可通過(guò)螞蟻百靈官方平臺(tái)Ling Studio在線體驗(yàn)與調(diào)用。（周小白）

02-11

2025年小微企業(yè)筑基、新興賽道發(fā)力、文旅升溫天眼查數(shù)據(jù)解碼經(jīng)濟(jì)活力

02-11

瓜子二手車創(chuàng)始人楊浩涌：從互聯(lián)網(wǎng)“老將”到投資高手，斬獲超2億回報(bào)

02-11

眾擎啟動(dòng)全球首個(gè)人形機(jī)器人格斗聯(lián)賽，以賽促研加速技術(shù)落地與人才孵化

02-11

具身智能“ChatGPT時(shí)刻”何時(shí)來(lái)？產(chǎn)業(yè)長(zhǎng)跑考驗(yàn)系統(tǒng)耐力

02-11

偉創(chuàng)電氣：以工控為基，憑一體化優(yōu)勢(shì)領(lǐng)跑機(jī)器人核心零部件賽道

02-11

2001年生“00后”吳東波：教機(jī)器人“學(xué)做人” 助力柳州“智造”升級(jí)

工業(yè)機(jī)器人學(xué)會(huì)一個(gè)簡(jiǎn)單動(dòng)作，至少需要重復(fù)300次，機(jī)器人訓(xùn)練師的目標(biāo)就是讓這些機(jī)器人將來(lái)能夠替代人工去做重復(fù)性、危險(xiǎn)性比較高的工作。目前，廣西柳州市已培育人工智能終端及機(jī)器人規(guī)上企業(yè)48家，2025年該產(chǎn)業(yè)…

02-11

螞蟻集團(tuán)開(kāi)源全模態(tài)大模型Ming-Flash-Omni 2.0 多項(xiàng)能力升級(jí)達(dá)開(kāi)源領(lǐng)先水平

02-11

螞蟻集團(tuán)開(kāi)源全模態(tài)大模型Ming-flash-omni 2.0，多模態(tài)能力再升級(jí)助力開(kāi)發(fā)者

02-11

央視財(cái)經(jīng)聯(lián)合天眼查：以數(shù)據(jù)為筆勾勒中國(guó)經(jīng)濟(jì)活力全景圖

02-11

蘋果積極應(yīng)對(duì)內(nèi)存漲價(jià)挑戰(zhàn) iPhone 18 Pro系列有望維持上代售價(jià)

02-11

極智嘉Gino 1亮相：倉(cāng)儲(chǔ)自動(dòng)化新突破，引領(lǐng)全流程無(wú)人倉(cāng)新未來(lái)

02-11

螞蟻集團(tuán)開(kāi)源Ming-Flash-Omni 2.0：全模態(tài)突破，開(kāi)啟多模態(tài)應(yīng)用新篇章

02-11

AI賦能下的“隱形枷鎖”：高效背后工作強(qiáng)度悄然攀升的困局

02-11

螞蟻開(kāi)源Ming-Flash-Omni 2.0：全模態(tài)突破，多項(xiàng)能力領(lǐng)先成新標(biāo)桿

02-11

點(diǎn)擊查看更多 +

全站最新

48小時(shí)！xAI連失兩根“頂梁柱”

別只盯著AI，這個(gè)賽道即將加速

微軟探索高溫超導(dǎo)重構(gòu)數(shù)據(jù)中心供電直指AI算力“電力瓶頸”

麥格理：首予文遠(yuǎn)知行"跑贏大市"評(píng)級(jí)，目標(biāo)價(jià)46港元/17.5美元

港股異動(dòng)丨裕元集團(tuán)跌超9%，1月經(jīng)營(yíng)收益同比跌12.5%

中國(guó)飛鶴春節(jié)獻(xiàn)映《東北真行》新篇章講述匠心與守護(hù)的時(shí)代故事

熱門內(nèi)容

本欄最新

長(zhǎng)城魏牌V9X來(lái)襲！近5米3大身軀，2.0T插混續(xù)航超千公里，實(shí)力幾何？

央視聚焦東風(fēng)汽車：以創(chuàng)新智造引領(lǐng)，驅(qū)動(dòng)中國(guó)汽車產(chǎn)業(yè)穩(wěn)健邁向新征程

閔行新春沙龍：網(wǎng)絡(luò)創(chuàng)作者共探優(yōu)質(zhì)內(nèi)容創(chuàng)作，共繪閔行發(fā)展新畫卷

理想汽車新突破：全新L9馬赫100雙芯片有效算力遠(yuǎn)超英偉達(dá)Thor U

問(wèn)界星光之夜余承東解讀品牌命名，大模型AI將升級(jí)老車主，銷量目標(biāo)再?zèng)_刺

長(zhǎng)城補(bǔ)齊產(chǎn)品短板！魏牌V9X官圖曝光，攜新技術(shù)入局綠牌全尺寸SUV賽道

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

螞蟻集團(tuán)開(kāi)源全模態(tài)大模型Ming-flash-omni 2.0 性能對(duì)標(biāo)Gemini 2.5 Pro