阿里巴巴(中國)有限公司近期在專利領域有了新動作。企查查APP的信息顯示,該公司申請公布了一項名為“視頻生成方法、視頻生成模型的訓練方法及任務平臺”的專利。
根據專利摘要內容,這項專利涉及一套完整的視頻生成技術體系,涵蓋視頻生成方法、視頻生成模型的訓練方法以及任務平臺。具體而言,在視頻生成方法中,首先要獲取參考圖像和參考音頻,其中參考圖像需包含參考對象的視覺信息。接著,系統會分別針對參考圖像中的視覺信息提取參考對象的視覺特征,同時對參考音頻提取音頻特征。隨后,基于視覺特征與音頻特征之間的交互特性,預測在音頻特征影響下目標對象的參考動作信息,這里的目標對象是基于參考對象生成的。最后,依據參考動作信息和參考音頻,生成目標對象對應的視頻。
該專利技術的一大亮點在于,能夠有效提升視頻中目標對象的視覺信息與對應音頻的匹配程度,進而顯著改善視頻的呈現效果。這一創新成果有望為視頻生成領域帶來新的技術突破和應用可能。












