滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

北京智源突破性成果登《自然》正刊：自回歸路線統一多模態學習

時間：2026-01-30 01:18:06 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

在生成式人工智能領域，一項來自中國科研機構的重要突破引發全球關注。北京智源人工智能研究院研發的Emu3多模態大模型，通過統一的技術路徑實現了對文本、圖像和視頻的高效處理，相關成果已發表于國際頂級學術期刊《自然》。這一研究首次驗證了自回歸架構在多模態學習中的普適性，為構建通用人工智能系統開辟了新方向。

傳統人工智能系統處理不同類型數據時，往往需要設計專門的模型架構：自然語言處理依賴Transformer結構，圖像生成采用擴散模型，視頻分析則需結合3D卷積網絡。這種"分科而治"的模式導致系統復雜度高、協同效率低，且難以實現跨模態的深度融合。智源研究院的研究團隊突破性地證明，通過擴展GPT核心的"預測下一個詞元"機制，可以構建出同時具備多模態理解與生成能力的原生模型。

實驗數據顯示，Emu3模型在圖像生成、圖文問答、視頻預測等任務中，性能達到甚至超越了專門訓練的專用模型。該模型采用純自回歸架構，通過統一的數據編碼方式，將不同模態的信息轉化為離散token序列進行聯合訓練。這種設計不僅簡化了模型結構，更賦予系統強大的擴展潛力——研究人員發現，隨著參數規模的增加，模型在復雜場景理解、物理規律模擬等任務上展現出顯著提升。

《自然》期刊審稿人特別指出，該研究最突出的貢獻在于解決了多模態學習的統一框架問題。此前學術界普遍認為，不同模態數據需要定制化的學習策略，而Emu3的實踐表明，通過合理的架構設計，單一模型完全可以掌握跨模態的表征能力。這種統一性不僅降低了開發成本，更為構建具備人類認知水平的通用智能體奠定了基礎。

基于Emu3技術路徑的迭代版本Emu3.5，已初步展現出對物理世界的理解能力。在測試中，該模型能夠預測動態場景的演變趨勢，例如模擬物體運動軌跡、推斷液體流動方向等。這種對因果關系的把握能力，標志著多模態大模型從"感知智能"向"認知智能"的重要跨越。

據研究團隊介紹，這項突破源于智源研究院2020年啟動的"悟道"大模型計劃。經過五年持續攻關，該機構已形成覆蓋多模態學習、具身智能、生命科學等領域的完整技術體系。其即將發布的"悟界"大模型系列，將重點突破數字世界與物理世界的交互瓶頸，包含具身大腦、數字器官、生命模擬等多個創新方向，旨在構建支撐通用人工智能發展的基礎設施。

這不再是簡單的工具升級。它是GPT-5.3家族里的「閃電俠」。最關鍵的是，它完成任務的時間縮短了一大截。在評估智能體軟件工程能力的SWE-Bench Pro和Terminal-Bench 2.0兩項基準…

02-13

中國移動啟動戰略重組：聚焦AI與算力，開啟從規模到能力競爭新篇章

此次調整的核心聚焦于人工智能與算力兩大關鍵領域，旨在通過組織變革重塑企業發展格局，引領行業從規模競爭轉向能力比拼的新階段。這一轉變源于深刻的行業背景變化：隨著5G基礎設施投資高峰漸退，傳統通信業務增長進一…

02-13

智慧產業園區建設全解析：從規劃到落地，打造智能化管理新生態

基礎設施層涵蓋通信網、物聯網、智能硬件等基礎配套；核心平臺層為運營核心，包含園區綜合管理、園企互動、應用集成、物聯網運營四大關鍵組件，實現數據統一、設備互聯、系統集成；應用層落地智慧辦公、智慧樓宇、智慧物管等…

02-13

加速進化2025年成績斐然：簽單破億，邀員工攜機器人共度新春佳節

2026年2月11日南方小年，加速進化創始人、CEO程昊向全員發布新春內部信，回顧2025年核心突破，明確企業長期發展理念，并推出新春員工福利。信中披露，2025年加速進化人形機器人全球簽單超千臺、金額破億…

02-13

韓美半導體推新型鍵合設備，為HBM5及HBM6量產發展注入新動力

IT之家 2 月 13 日消息，據韓媒《Chosun Biz》報道，韓美半導體（Hanmi Semiconductor）于 11日參加“Semicon Korea 2026”半導體展會，同步展示新型寬幅熱壓…

02-13

OpenAI新模型GPT-5.3-Codex-Spark來襲，每秒千Token開啟代碼生成新速度

這不再是簡單的工具升級。它是GPT-5.3家族里的「閃電俠」。最關鍵的是，它完成任務的時間縮短了一大截。在評估智能體軟件工程能力的SWE-Bench Pro和Terminal-Bench 2.0兩項基準…

02-13

美圖“開拍”2月底升級：接入Seedance2.0，以“模型容器”策略領跑口播視頻賽道

02-13

擎天租春節訂單激增超5000單，用戶常態化需求顯現加速全國布局

02-13

馬年汽車業新征程：以“和光同塵”之姿破局前行謀發展

02-13

億咖通2025年財報亮眼：雙輪驅動全球化布局駛入增長新航道

02-13

美圖公司加碼AI視頻賽道：開拍預計2月底上線Seedance 2.0版本

02-13

春節訂單預計破5000單！擎天租GMV環比增長80%

02-13

白領“裁員潮”將至？華爾街正在搜尋下一個受 AI 威脅的職業

02-13

擺脫英偉達“依賴癥”！OpenAI 聯手 Cerebras 發布 GPT-5.3-Codex-Spark：百億美金算力首顆果實落地

02-13

Apple Creator Studio生成式AI功能遭質疑：實際用量與宣傳承諾差距大

02-13

點擊查看更多 +

全站最新

寶馬M5旅行版中期改款諜照曝光 4.4T V8插混加持 2027年春將登場

2025年小米汽車200+功能煥新升級，車主最鐘愛的十大功能榜單揭曉

日產今年新車扎堆來襲！2月24日四車齊發，多款重磅車型蓄勢待發

大眾寶來直降3萬！性價比飆升，剛需用戶過年購車新選擇

日產全新軒逸實車到店！轎跑外觀配雙聯屏內飾 1.6L動力一季度上市

奔馳開啟新車“狂飆”模式，2026至2027年超30款新車蓄勢待發

熱門內容

本欄最新

馬年汽車業新征程：以“和光同塵”之姿破局前行謀發展

宇樹王興興：具身智能正爬坡，未來一兩年或迎拐點熱度遠超互聯網

賈躍亭再啟新程：FF攜手保定伙伴，FX車型量產能否成救命稻草？

東營科技館汽車主題展免費開放！邀您共赴百年科技變遷探索之旅

北汽元境入局AI賽道：務實布局下，能否助北汽新能源破局突圍？

深圳美格智能成功過會港交所，無線通信模組領域“小巨人”再啟新程

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

北京智源突破性成果登《自然》正刊：自回歸路線統一多模態學習