近日,一款代號為“Hunter Alpha”的神秘大模型在全球最大API聚合平臺OpenRouter上引發廣泛關注,其曾一度登頂大模型調用榜,引發外界對“DeepSeek V4早期版本”的猜測。如今,這一懸念終于揭曉——小米正式宣布認領該模型,并同步推出三款全新大模型:MiMo-V2-Pro、MiMo-V2-Omni與MiMo-V2-TTS,用戶可限時免費體驗一周。
作為旗艦基座模型,Xiaomi MiMo-V2-Pro以超1T的總參數量(42B激活參數)和混合注意力架構為核心,支持1M上下文長度處理。在Artificial Analysis排行榜中,該模型位列全球第八、國內第二,性能表現亮眼。在智能體框架應用中,其整體體驗已超越Claude Sonnet 4.6,接近Opus 4.6水平,而API定價僅為后者的五分之一。目前,MiMo-V2-Pro已開放API服務,采用階梯式計費模式,滿足不同規模需求。
針對多模態交互場景,小米推出的MiMo-V2-Omni模型展現出強大實力。在音頻理解領域,該模型支持環境聲分類、多說話人分離及超10小時長音頻深度解析,綜合表現優于Gemini 3 Pro,成為當前音頻理解領域的標桿之一。圖像理解方面,其多學科視覺推理與復雜圖表分析能力超越Claude Opus 4.6,逼近Gemini 3 Pro等頂尖閉源模型。MiMo-V2-Omni還支持原生音視頻聯合輸入,實現跨模態視頻內容理解。
語音合成領域,Xiaomi MiMo-V2-TTS基于自研Audio Tokenizer與多碼本語音-文本聯合建模架構,突破傳統模型局限。該模型可實現單句內語氣轉折與情感遞變,精準還原人類自然韻律,甚至在歌唱場景中能準確表達音高與節奏。更引人注目的是,其支持東北話、四川話、粵語等十余種方言發音,并可進行角色化風格演繹,為語音交互增添更多可能性。
伴隨新模型發布,小米同步上線MiMo Studio官網及MiMo Claw工具。該工具集成最新模型能力,提供WebOffice在線文檔預覽功能,并支持一鍵部署OpenClaw框架。用戶可免費體驗30分鐘,利用其內置文件系統實現網站內容抓取、文檔修改等操作,體驗“零成本”智能辦公新方式。











