影視圈的焦慮情緒正隨著AI技術(shù)的突破而蔓延。當字節(jié)跳動旗下即夢平臺悄然上線Seedance 2.0時,這個未舉辦發(fā)布會、僅通過飛書發(fā)布產(chǎn)品文檔的舉動,卻在行業(yè)內(nèi)外引發(fā)了軒然大波。這款被內(nèi)部稱為“Kill the game”的視頻生成模型,憑借六十秒多鏡頭、分鏡腳本控制、原生音畫同步等能力,讓《黑神話:悟空》制作人馮驥斷言“AIGC的童年時代結(jié)束了”,科技博主影視颶風Tim更是連用六個“恐怖”形容其效果。
這場技術(shù)狂歡背后,隱藏著影視行業(yè)對未來的深層憂慮。過去十年,國內(nèi)影視人苦苦追趕好萊塢的“電影工業(yè)”模式,如今卻面臨被AI重新解構(gòu)的危機。Seedance 2.0的出現(xiàn),讓“人人都能當導演”的想象成為現(xiàn)實,但行業(yè)更關(guān)心的是:這種技術(shù)路線究竟是突破性的創(chuàng)新,還是工程化優(yōu)化的終點?
技術(shù)路線的分歧早已存在。2024年OpenAI的Sora首次亮相時,圖靈獎得主楊立昆就潑下冷水,稱其及同類產(chǎn)品不過是“像素幻覺”。他指出,缺乏對物理規(guī)律、因果關(guān)系和空間關(guān)系的理解,將限制視頻生成模型的發(fā)展。這場爭論將AI視頻領(lǐng)域分為兩大陣營:以字節(jié)、快手為代表的“世俗派”,追求電影感與敘事流暢,通過數(shù)據(jù)驅(qū)動進行風格模仿;以楊立昆的AMI Labs、英偉達Cosmos平臺為代表的“物理派”,則致力于讓AI理解物理世界的本質(zhì)規(guī)律。
兩種路線的差異在應(yīng)用層面尤為明顯。Seedance 2.0優(yōu)化了“導演意圖→像素”的轉(zhuǎn)化過程,用戶輸入提示詞即可自動生成帶完整音軌的多鏡頭視頻。這種工程優(yōu)化極大提升了效率——原本需要專業(yè)團隊數(shù)天完成的拍攝剪輯,現(xiàn)在幾分鐘就能完成。但問題在于,生成的內(nèi)容是一次性的,無法提取城市、角色等資產(chǎn)進行復用,更無法調(diào)整物理屬性或?qū)崿F(xiàn)交互。這種“用完即棄”的特性,將世俗派的天花板鎖定在內(nèi)容消費領(lǐng)域。
物理派則打開了另一扇門。當AI真正理解物理規(guī)律時,生成的不再是像素序列,而是包含質(zhì)量、碰撞、光照等屬性的虛擬環(huán)境。這種環(huán)境可被游戲引擎調(diào)用,用于機器人訓練或自動駕駛仿真測試。迪士尼《曼達洛人》的虛擬制片系統(tǒng)StageCraft就是典型案例:其核心的270度LED幕墻由虛幻引擎驅(qū)動,生成的3D建筑、地形等資產(chǎn)可跨劇集復用,甚至授權(quán)給游戲團隊開發(fā)交互世界。這種“資產(chǎn)思維”與“像素思維”的差異,決定了物理派擁有更廣闊的市場空間。
英偉達與工業(yè)光魔的合作進一步展示了物理派的潛力。在《侏羅紀世界:統(tǒng)治》中,Omniverse平臺連接Maya、Houdini等工具,實現(xiàn)了跨軟件的實時物理協(xié)作。恐龍肌肉變形、植被風力擺動等效果在不同軟件間同步,使物理仿真成為共享基礎(chǔ)設(shè)施。這種技術(shù)不僅改變了影視制作流程,更讓虛擬片場的環(huán)境參數(shù)可直接用于工業(yè)機器人訓練和自動駕駛測試,展現(xiàn)了橫跨娛樂與工業(yè)的潛力。
成本對比揭示了更深層的競爭格局。按字節(jié)即夢的定價,69元/月的會員每月可獲得1080積分,生成15秒視頻消耗90積分,即每秒約0.77元。雖然遠低于傳統(tǒng)制作成本,但仍不足以讓普通消費者無限制使用。相比之下,物理派資產(chǎn)復用性的優(yōu)勢將在長期顯現(xiàn)——一個虛擬城市建模可同時服務(wù)于影視、游戲、仿真和訓練四個行業(yè),邊際成本趨近于零。這種分層架構(gòu)可能成為主流:底層是物理世界模型,上層疊加不同行業(yè)的表現(xiàn)力需求。
當前的市場競爭已趨白熱化。快手可靈AI到2025年底擁有6000萬創(chuàng)作者,生成超6億個視頻,合作企業(yè)超3萬家,2026年1月MAU突破1200萬。字節(jié)Seedance 2.0上線即遭遇可靈3.0的正面競爭,兩家在電影感生成、多鏡頭敘事等領(lǐng)域展開激烈角逐。與此同時,Runway、Veo 3.1等海外玩家也在持續(xù)迭代控制力與物理模擬能力。當世俗派陷入同質(zhì)化競爭時,物理派的資產(chǎn)復用優(yōu)勢將逐步顯現(xiàn)。
字節(jié)的應(yīng)對策略體現(xiàn)了務(wù)實主義。Seedance 2.0的核心價值不在于生成美觀的視頻,而在于多模態(tài)精準控制——可同時輸入九張圖片、三段視頻和三段音頻,精確復現(xiàn)導演意圖。這種確定性輸出正是廣告和電商行業(yè)的剛性需求。在用B端利潤支撐發(fā)展的同時,字節(jié)在物理派方向保持技術(shù)存在,與斯坦福、清華等學術(shù)機構(gòu)保持聯(lián)系,但未大規(guī)模擴張。這種“占坑”策略既避免了過早投入高風險領(lǐng)域,又為未來轉(zhuǎn)型保留了可能性。
然而,真正的挑戰(zhàn)在于掌握分發(fā)權(quán)。在AI視頻時代,分發(fā)權(quán)的支撐不再是推薦算法,而是世界模型的能力。未來十年,計算入口將從屏幕轉(zhuǎn)向空間交互,物理可信的虛擬世界將成為底層基礎(chǔ)設(shè)施。字節(jié)當前的技術(shù)路線仍停留在數(shù)據(jù)驅(qū)動的風格模仿,與真正的物理理解存在本質(zhì)差距。例如,在測試中,燒紅的鐵球砸向冰塊時,系統(tǒng)未能正確模擬熔化和凹陷效果,暴露了物理引擎的不足。
科技行業(yè)的規(guī)律表明,改變游戲規(guī)則的技術(shù)往往不是最時髦的,而是定義了下一層基礎(chǔ)設(shè)施的。字節(jié)現(xiàn)在需要的不是糾結(jié)于Seedance 3.0能否在“電影感”上更進一步,而是在現(xiàn)有勝利基礎(chǔ)上,向物理派的深水區(qū)進發(fā)。這或許不是換個姿勢繼續(xù)內(nèi)卷,而是換一個維度定義未來的關(guān)鍵一步。












