昆侖萬維宣布其天工 AI 大模型 SkyReels V4在 Artificial Analysis 的文生視頻(含音頻)賽道中榮登全球第一。該模型性能顯著超越了 Kling3.0、Google Veo3.1、Vidu Q3及 OpenAI Sora2等主流模型,成為目前全球視頻生成能力最強的 AI 大模型。
核心突破:全模態(tài)強化學習與邏輯推理SkyReels V4在技術(shù)架構(gòu)上實現(xiàn)了兩大核心變革,解決了視頻生成中的一致性與敘事邏輯難題:
強化學習體系(RL):通過搭建全模態(tài)語義 Reward 模型并采用階梯式課程學習路徑,為模型注入了邏輯推理能力,實現(xiàn)了1080p15秒商用級長序列生成。
高階參考任務:新增“關(guān)鍵幀參考”與“網(wǎng)格圖參考”能力。前者可精準推演節(jié)點間的連貫畫面;后者支持上傳多張劇情圖,確保短劇創(chuàng)作中角色特征與場景風格全程統(tǒng)一。
隨著榜單登頂,SkyReels V4的 API 入口也正式面向全場景開放。其能力完整覆蓋了該模型的所有核心功能:
全功能覆蓋:包括文生視頻、圖生視頻、多模態(tài)參考生成、視頻編輯與修復以及音畫聯(lián)合生成。
低門檻賦能:電商、教育、內(nèi)容平臺及開發(fā)者團隊無需投入巨額研發(fā)成本,即可直接調(diào)用全球頂尖的音視頻生成能力。
昆侖萬維此前已陸續(xù)發(fā)布并開源了 SkyReels 系列多個模型。從 V1的人像驅(qū)動到 V2的長視頻生成,再到如今 V4在音畫同步與邏輯表現(xiàn)上的全面爆發(fā),SkyReels 展現(xiàn)了從“能生成”到“生成得好”的跨越。
目前,SkyReels V4的技術(shù)報告已同步發(fā)布,開發(fā)者可通過其官網(wǎng)平臺獲取 API 文檔并開展業(yè)務集成。這一進展標志著中國 AI 在視聽內(nèi)容生成的垂直賽道上已處于全球領(lǐng)先位置。








