滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

阿里Wan2.7-Video大模型來襲，視頻編輯自由度高，輕松實現創意改造

時間：2026-04-03 22:19:45 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

阿里通義實驗室近日推出全新視頻創作大模型Wan2.7-Video，該模型突破傳統視頻編輯框架，支持文本、圖像、視頻、音頻全模態輸入，用戶可通過自然語言指令實現畫面結構重組、劇情動態調整、局部細節優化及時序變化控制。模型核心亮點在于"一句話改視頻"功能，能在保持光影材質一致性的基礎上，同步處理多張圖像輸入，實現跨模態素材的無縫融合。

在劇情控制領域，該模型首創視頻續寫與尾幀控制的聯合機制。用戶既可指定結尾畫面進行定向續寫，也能通過多達5個視頻主體參考實現復雜場景構建。實驗數據顯示，模型能精準保留原視頻動作序列與鏡頭運動軌跡，同時支持季節變換、畫風轉換等全局修改。當測試人員要求將夏日背景改為深秋場景時，系統自動調整植被色彩與光照角度，人物服裝光影效果同步適配新環境。

角色編輯系統展現強大適應性。在角色替換測試中，模型成功將歐美男性主角替換為中國男性形象，不僅完整保留原始臺詞與嘴型同步，還自動修正服裝光影以匹配場景光源。更引人注目的是行為修改功能，當指令要求"坐沙發的女生改為站立打游戲"時，系統在保持人物姿勢自然過渡的同時，重新計算空間布局與光影反射，確保新動作符合物理規律。

技術團隊突破性地將電影工業流程解構為可編程模塊。模型內置40余種微表情庫，能精準演繹從驚喜到困惑等復雜情緒變化。通過學習大量專業劇本，系統掌握戲劇結構編排規律，可根據"西部片"或"科幻片"等類型指令，自動生成匹配的光影參數與色彩方案。在運鏡控制方面，支持推拉搖移等基礎鏡頭語言，更能實現希區柯克變焦等復合技巧，單條指令即可完成從分鏡腳本到成片輸出的全流程。

多模態參考系統開創行業新標準。除常規圖像視頻參考外，模型特別優化多宮格漫畫轉動畫功能，能自動識別分鏡邏輯并生成連貫動態畫面。音頻處理模塊得到專項強化，通過預訓練架構提升人聲真實度與音畫同步精度，在測試中成功還原樂器演奏的細微力度變化。影視知識庫的引入使角色表演更具專業水準，人物走位、手勢幅度等細節均符合鏡頭語言規范。

該模型的推出標志著視頻創作進入精準控制時代。傳統需要逐幀調整的復雜操作，現在可通過自然語言批量處理。技術文檔顯示，底層架構經過效率優化，在保持4K分辨率輸出的同時，將推理速度提升3倍。這種技術突破正在重塑創作流程，專業團隊可專注核心創意，技術實現環節交由智能系統完成，顯著降低高質量視頻的生產門檻。

更多>同類資訊

亞馬遜洽購Globalstar遇阻蘋果持股成關鍵變量衛星通信格局或生變

04-03

榮耀攜手京東：三年全領域千億目標，共繪產品、用戶、生態合作新藍圖

04-03

諾獎得主助力上海三本新刊啟航 “科學家群體辦刊”模式探索新路徑

04-03

小米手表5黑色eSIM版來襲：雙芯雙系統加持，2299元開啟智能穿戴新體驗

04-03

月之暗面“穿越計劃”出爐：面向27屆畢業生提前授期權，搶灘AI高端人才

04-03

小米“招兵買馬”：挖角特斯拉兩大核心高管，劍指純電市場新巔峰

04-03

詞元：解鎖智能經濟新圖景驅動新型商業邏輯加速演進

吳迪說，我國的大模型廠商做了非常多的算法創新，在推理成本、響應速度上不斷優化，能以更少的詞元完成復雜任務。黃山表示，要構建起安全、高效、普惠的人工智能基礎設施，持續提升大模型推理效率、降低單個詞元成本，讓人工…

04-03

Sora退場：生成視頻賽道變局，中國大廠如何開啟新征程？

Anthropic極其克制，不碰花里胡哨的音視頻，把所有算力全部梭哈在文本和代碼上，其推出的Claude Code工具在編程市場一路高歌猛進，9個月就做到了25億美元年化收入，拿下了高達54%的市場份額，而O…

04-03

Token共識下火山引擎的機遇與挑戰：120萬億背后的戰略布局與行業變局

當AI Agent運行規模與任務復雜度同步提高，以OpenClaw為代表的各類“龍蝦”智能體產品，極大推升了Token消耗的天花板，加之視頻、音頻等模型的調用，相較文字對話的Token消耗也有指數級的增長，…

04-03

火山引擎譚待談“龍蝦”市場：潛力巨大，以優質模型與整合能力迎機遇

火山引擎總裁譚待在會后的采訪環節告訴新京報貝殼財經記者，他對于字節版本“龍蝦”ArkClaw有信心，同時相比于廣闊的市場，目前龍蝦產品還處于藍海階段，市場蛋糕足夠大。譚待對貝殼財經記者表示，字節版龍蝦Ark…

04-03

谷歌Gemma 4開源AI模型登場：性能躍升，采用Apache 2.0許可證更自由

A：Gemma 4在多個方面顯著改進：性能上提供更好的推理、數學和指令遵循能力；延遲更低，26B專家混合模型實現了更高的Token每秒處理速度；移動版本E2B和E4B實現"近零延遲"并降低內存和電池使用；上…

04-03

谷歌新一代開源模型Gemma 4發布，多規格適配多場景，支持多語言推理與代碼生成

△資料圖當地時間4月2日，谷歌宣布推出新一代開源模型Gemma4，稱這是其迄今“最智能”的開源模型，主要面向高級推理和智能體工作流等應用場景。谷歌稱，Gemma 4基于與“雙子座3”（Gemini 3）…

04-03

Sora退場：AI視頻賽道轉向，國內大廠開啟商業變現新征程

Anthropic極其克制，不碰花里胡哨的音視頻，把所有算力全部梭哈在文本和代碼上，其推出的Claude Code工具在編程市場一路高歌猛進，9個月就做到了25億美元年化收入，拿下了高達54%的市場份額，而O…

04-03

奇富數科攜手阿里云金融AI聯盟以智能體矩陣助力銀行業邁向AI新時代

依托自研AI信貸智能體產品體系，奇富數科將與阿里云及百余家生態伙伴深度協同，共拓金融智能體百億市場，助力銀行業加速邁向AI原生時代。在為機構提供服務的實施過程中，彭新榮分享道，奇富數科將與機構共建大模型后訓…

04-03

ATH事業群發力，阿里AI“體系化”突圍，開啟“強協同”新篇章

Alibaba Token Hub（ATH）事業群成立后僅兩周，阿里巴巴便以前所未有的速度接連發布了Qwen3.6-Plus、Qwen3.5-Omni、Wan2.7-Image三款重磅模型，在多模態、編程、…

04-03

點擊查看更多 +

全站最新

AI for Process，從"智變"到"質變"，神州數碼舉辦2025年度業績說明會

雷軍直播拆解新一代SU7：鎖單量破4萬，交付提速，“百色計劃”引期待

紐北賽道現身紅色猛獸！小米YU7 GT實車曝光，千匹馬力劍指最速SUV

車企營銷新玩法：從流量接梗到人格破圈，2026車圈花式出圈大賞

意念操控未來新篇平安銀行“企望中國行”與企業家共探強腦科技奧秘

清明經濟新圖景：文化傳承與春日體驗的雙向賦能

熱門內容

本欄最新

雷軍直播拆解新一代SU7：鎖單量破4萬，交付提速，“百色計劃”引期待

紐北賽道現身紅色猛獸！小米YU7 GT實車曝光，千匹馬力劍指最速SUV

車企營銷新玩法：從流量接梗到人格破圈，2026車圈花式出圈大賞

意念操控未來新篇平安銀行“企望中國行”與企業家共探強腦科技奧秘

中美Robotaxi“停車”事件引關注：是故障還是安全策略的探索？

中美無人車“停車”事件引熱議：是謹慎之舉，還是技術之困？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

阿里Wan2.7-Video大模型來襲，視頻編輯自由度高，輕松實現創意改造