字節(jié)跳動(dòng)在圖像生成領(lǐng)域再掀波瀾,其最新推出的Seedream 5.0 Preview模型已正式登陸剪映、CapCut及小云雀等平臺(tái),并在即夢(mèng)AI開啟灰度測(cè)試。用戶目前可限時(shí)免費(fèi)體驗(yàn)圖片生成功能,該模型支持2K分辨率直出及4K分辨率AI增強(qiáng)輸出,標(biāo)志著字節(jié)在AI創(chuàng)作工具領(lǐng)域邁出重要一步。
據(jù)CapCut官方披露,新模型首次引入檢索生圖功能,顯著提升對(duì)提示詞的理解精度,可生成細(xì)節(jié)更豐富、紋理更精致的圖像。用戶還能通過(guò)參數(shù)調(diào)整實(shí)現(xiàn)精準(zhǔn)控制,例如在生成"特寫電影感肖像"時(shí),模型能準(zhǔn)確呈現(xiàn)逆光發(fā)絲、皮膚光澤及前景柔焦效果。對(duì)比測(cè)試顯示,當(dāng)輸入"奧斯卡紅毯風(fēng)格"提示詞時(shí),Seedream 5.0 Preview可自動(dòng)生成包含背景板、攝影師及小金人元素的完整場(chǎng)景。
在實(shí)用性場(chǎng)景測(cè)試中,模型展現(xiàn)出較強(qiáng)知識(shí)整合能力。當(dāng)要求生成"已官宣參加2026春晚的機(jī)器人海報(bào)"時(shí),雖然未能完全理解"已官宣"的限定條件,但仍準(zhǔn)確呈現(xiàn)機(jī)器人上春晚的視覺(jué)元素,且在大段文字生成中保持穩(wěn)定輸出。更復(fù)雜的抽象需求測(cè)試中,輸入"靜謐科技感且?guī)в新淙沼鄷煹聂[鐘圖片"后,模型成功融合科技元素與自然光影,生成符合要求的創(chuàng)意圖像。
橫向?qū)Ρ蕊@示,Seedream 5.0 Preview在信息圖生成領(lǐng)域表現(xiàn)突出。以"特拉普修道院啤酒制作流程"為例,其生成的步驟說(shuō)明最為詳盡,每環(huán)節(jié)均配有文字注釋,但藝術(shù)設(shè)計(jì)感略遜于Nano Banana Pro。在復(fù)雜邏輯測(cè)試中,面對(duì)"左手寫字且背景顯示5:25時(shí)鐘"的超高難度要求,兩個(gè)模型均出現(xiàn)細(xì)節(jié)錯(cuò)誤,但Seedream 5.0 Preview生成結(jié)果呈現(xiàn)出現(xiàn)代、古風(fēng)、卡通等多元風(fēng)格。
技術(shù)升級(jí)層面,新模型重點(diǎn)強(qiáng)化三大能力:通過(guò)多步邏輯優(yōu)化提升空間理解力,借助風(fēng)格遷移技術(shù)增強(qiáng)紋理表現(xiàn),利用知識(shí)圖譜整合實(shí)現(xiàn)智能推理。在《靜夜思》古詩(shī)插圖測(cè)試中,模型準(zhǔn)確呈現(xiàn)"舉頭望明月"核心元素,但未能完整還原"床前明月光"的場(chǎng)景細(xì)節(jié)。參考圖生成測(cè)試顯示,當(dāng)輸入《閃靈》男主杰克照片并要求生成拜年圖時(shí),模型成功保留面部特征,同時(shí)添加燈籠、對(duì)聯(lián)等年味元素。
用戶反饋呈現(xiàn)分化態(tài)勢(shì)。部分創(chuàng)作者認(rèn)為新模型在中文理解、智能水平方面確有提升,但整體進(jìn)步幅度有限,有網(wǎng)友戲稱"相當(dāng)于加了搜索功能的4.5版本"。社交平臺(tái)討論顯示,實(shí)用導(dǎo)向的升級(jí)策略雖貼近創(chuàng)作需求,但在抽象語(yǔ)義理解、復(fù)雜構(gòu)圖等高級(jí)功能上仍存在技術(shù)瓶頸,這或許將成為下一代模型突破的重點(diǎn)方向。











