一個神秘模型——HappyHorse-1.0悄然登頂Artificial Analysis的AI Video Arena排行榜,力壓Seedance和可靈。
從昨天開始,它在文本轉視頻(無音頻)賽道便登頂第一。根據當前實時數據,其Elo分數已達到1375,直接甩開第二名Seedance 2.0大概100分左右。
這個分差相當夸張,簡直是斷層式碾壓。要知道,從第二名的Seedance 2.0到第十名,相差也不過50分左右。
在圖像轉視頻(無音頻)賽道,它更是跑出了1409的恐怖高分,刷新了該榜單的歷史紀錄。
而在有音頻賽道,目前HappyHorse-1.0也已經拿下全球第一的成績,超越Seedance 2.0。
多方消息稱,HappyHorse-1.0出自阿里旗下張迪領銜的淘天集團未來生活實驗室。
屠榜視頻Arena
Artificial Analysis的Video Arena的排名機制,是數千名真實用戶在完全不知情的情況下,對兩段生成結果進行盲測對比得出的Elo體系。
也就是說,多數用戶在不知道視頻由哪家模型生成的情況下,選擇了HappyHorse-1.0。
我也迫不及待地上手試了一下,在連續幾次盲測都選中「歡樂馬」之后,我開始感覺它的實力真的不容小覷。
先看第一個案例:
對比兩個視頻,可以明顯看出右邊的生成效果更具真實感,細節也更加豐富。無論是整體色調還是鏡頭的設置,都很像一個電影開場。
而左邊的嘛……雖然提示詞要求“血紅色的天空背景”,但這天空未免也太紅了,有點過于夸張。
選擇之后答案揭曉:右邊是「歡樂馬」,左邊是Pyramid-Flow。
再來看看這個:
很顯然,右邊的畫面更加自然,特寫-近景-遠景的鏡頭切換也很流暢,完全還原了提示詞要求的“長槍短炮”的新聞發布會場面。
相比之下,左邊的效果一開場就顯得有些怪異,主人公站的位置不太合理,也沒有營造出足夠熱烈的現場氛圍。
答案揭曉——右邊是「歡樂馬」,左邊則是Veo 3.1 Lite。
接下來是第三個案例:
可能因為輸入了提示圖片,這兩個模型的生成效果乍一看差不多。
但我還是選擇了右邊。原因是左邊的鏡頭拉近速度有點太快了,不太符合現場專注工作的安靜氛圍。
并且右邊的鏡頭拉近之后,會發現人物臉上的紋理被還原得更好,更具真實感;而左邊人物則顯得面部太光滑了。
投票之后,答案又揭曉了:右邊還是這匹「歡樂馬」,左邊則是PixVerse V6。
盲測了十幾個案例之后,但凡出現「歡樂馬」的,我大部分都選中了,只有少數幾個案例我沒有選擇「歡樂馬」而選了其他模型。
這實力可想而知,也難怪空降屠榜了。
根據目前已知消息,Happy Horse-1.0采用40層單流Transformer架構,原生支持音視頻同步生成,僅需8步去噪即可輸出1080P視頻。
在H100顯卡上生成5秒片段僅需38秒,推理速度較傳統模型大幅提升。其技術突破包括多模態統一建模、無CFG引導生成等。
原生支持中文(包括粵語)、英語、日語、韓語、德語、法語。
更重要的是,據說完全開源——基礎模型+蒸餾模型+超分+推理代碼,都會開源出來。
或出自阿里淘天
關于Happy Horse-1.0背后是哪家公司,目前猜測主要集中在國內。
而在眾多選項中,呼聲最高的是阿里淘天未來生活實驗室,由前快手Kling一號位張迪領導。
張迪,上海交通大學本碩畢業,職級P11,直接向淘天集團首席科學家兼阿里媽媽CTO鄭波匯報。
他于2010年畢業后便加入阿里,擔任資深技術專家,負責阿里媽媽大數據與機器學習工程架構。
2020年,他曾轉戰快手,歷任技術副總裁、大模型與多媒體技術團隊負責人。在快手,他牽頭了可靈大模型的底層架構研發與應用落地,成功推出了可靈1.0/2.0視頻生成模型。
2025年9月初,張迪加入嗶哩嗶哩,出任技術條線負責人。
2025年11月,張迪離開嗶哩嗶哩,重返阿里,擔任淘天集團未來生活實驗室負責人。
目前,Happy Horse-1.0還處于無官網(目前出現的幾個官網都被打假了)、無技術報告、無代碼庫的狀態。
有消息稱團隊現在每晚都在加班加點,10號會正式發布,也是可以期待一下了。










