字節(jié)跳動旗下火山引擎近日宣布,將于2026年情人節(jié)當(dāng)天推出豆包大模型的重大升級版本,同步更新音視頻創(chuàng)作模型Seedance 2.0與圖像創(chuàng)作模型Seedream 5.0 Preview。此次升級聚焦三大核心領(lǐng)域,通過技術(shù)突破與場景適配提升多模態(tài)生成能力,為企業(yè)級應(yīng)用與創(chuàng)意生產(chǎn)提供更高效的解決方案。
作為本次升級的核心,豆包大模型2.0將首次正式亮相。該版本在基礎(chǔ)模型架構(gòu)上實(shí)現(xiàn)突破性優(yōu)化,顯著提升語義理解、邏輯推理等底層能力,同時強(qiáng)化企業(yè)級Agent的自主決策與任務(wù)執(zhí)行效率。通過引入動態(tài)知識注入機(jī)制,模型可實(shí)時調(diào)用行業(yè)專屬數(shù)據(jù),滿足金融、醫(yī)療等垂直領(lǐng)域的精準(zhǔn)需求。
音視頻創(chuàng)作領(lǐng)域迎來里程碑式更新。Seedance 2.0在復(fù)雜動態(tài)場景生成方面達(dá)到行業(yè)領(lǐng)先水平,其運(yùn)動軌跡預(yù)測算法使人物交互自然度提升40%,可精準(zhǔn)還原武術(shù)對打、舞蹈編排等高難度動作。模型支持語音、視頻、圖像的全模態(tài)輸入,用戶可通過口頭描述修改畫面細(xì)節(jié),或用參考圖調(diào)整角色造型。針對影視制作痛點(diǎn),該版本特別優(yōu)化長鏡頭生成穩(wěn)定性,輸出內(nèi)容可直接用于廣告拍攝與短視頻工業(yè)化生產(chǎn)。
圖像創(chuàng)作模型Seedream 5.0 Preview引入革命性的實(shí)時檢索增強(qiáng)技術(shù),突破傳統(tǒng)模型的知識時效性限制。通過與權(quán)威數(shù)據(jù)庫的動態(tài)連接,模型可自動獲取最新賽事結(jié)果、科技進(jìn)展等實(shí)時信息,確保生成的新聞配圖、產(chǎn)品海報(bào)包含最新元素。在多語言處理方面,新增的跨文化知識圖譜覆蓋200個專業(yè)領(lǐng)域,使模型能準(zhǔn)確理解不同語境下的隱喻表達(dá)。測試數(shù)據(jù)顯示,該版本在主體一致性指標(biāo)上提升25%,尤其擅長處理多人物合影、復(fù)雜場景構(gòu)圖等高難度任務(wù)。
技術(shù)團(tuán)隊(duì)透露,此次升級采用混合專家架構(gòu)(MoE),通過動態(tài)路由機(jī)制將參數(shù)調(diào)用效率提升60%,在保持模型輕量化的同時實(shí)現(xiàn)性能躍遷。火山引擎表示,升級后的模型將開放更細(xì)粒度的控制接口,支持開發(fā)者通過API調(diào)用自定義工作流,進(jìn)一步降低AI創(chuàng)作的技術(shù)門檻。











