近日,AI視頻領域迎來一則重磅消息:一款名為HappyHorse-1.0的視頻生成模型突然空降Artificial Analysis的AI Video Arena排行榜,并在多個細分領域展現(xiàn)出強勁實力。據(jù)技術評測機構數(shù)據(jù)顯示,該模型在文本轉視頻(無音頻)和圖像轉視頻(無音頻)任務中全面超越Seedance2.0與可3.0,在文本轉視頻(有音頻)賽道以微弱優(yōu)勢領跑,圖像轉視頻(有音頻)領域則與Seedance2.0持平。這一成績使其迅速成為行業(yè)焦點,引發(fā)技術社區(qū)對模型架構與訓練方法的廣泛討論。
多方信源向記者證實,HappyHorse-1.0系阿里巴巴內部研發(fā)項目,由前快手副總裁、可靈技術負責人張迪領銜開發(fā)。這位在多模態(tài)AI領域擁有豐富經(jīng)驗的技術專家,于2025年11月重新加入阿里體系,直接推動該項目的快速落地。據(jù)知情人士透露,阿里云計劃將該模型部署至百煉平臺,為用戶提供更便捷的AI視頻生成服務,這一決策與阿里巴巴近期進行的組織架構調整存在直接關聯(lián)。
值得注意的是,HappyHorse-1.0的突圍并非偶然。其技術團隊在模型訓練中采用了創(chuàng)新的動態(tài)注意力機制,有效解決了長視頻生成中的語義連貫性問題。特別是在音頻與視頻的同步處理上,通過引入跨模態(tài)對齊算法,顯著提升了有音頻場景下的用戶觀感。這些技術突破在排行榜的細分指標中得到充分體現(xiàn):在涉及復雜場景切換的測試用例中,該模型的表現(xiàn)較同類產(chǎn)品提升超過30%。
截至發(fā)稿前,阿里巴巴官方尚未對此事作出正式回應。但行業(yè)分析師指出,隨著AI視頻生成技術進入商業(yè)化關鍵期,頭部科技公司正通過技術整合與人才爭奪構建競爭壁壘。HappyHorse-1.0的亮相,不僅展示了阿里在多模態(tài)大模型領域的持續(xù)投入,也預示著AI視頻應用將進入更高質量的發(fā)展階段。技術社區(qū)普遍期待,隨著模型正式上線,更多開發(fā)者能夠參與生態(tài)建設,推動整個行業(yè)的技術迭代。








