月之暗面公司正式宣布開源其新一代多模態智能體模型K2.5,該模型在復雜任務處理、多智能體協同及視覺編程領域實現突破性進展。創始人楊植麟通過視頻演示展示了模型核心能力,強調這是公司迄今為止功能最強大的技術成果。
在任務處理架構上,K2.5突破傳統單智能體模式,可動態組建包含100個子智能體的集群系統。該集群能并行執行1500次工具調用,通過并行智能體強化學習技術實現自主協調,無需人工預設工作流。測試數據顯示,在文檔分析、深度搜索等復雜場景中,任務執行效率較前代提升最高達4.5倍,端到端運行時間縮短80%。
基準測試表現印證了技術優勢:在HLE-Full綜合推理、BrowseComp瀏覽交互等三項智能體評估中均獲首位;編程能力方面,SWE-Bench多語言測試和驗證集測試雙料冠軍;文檔理解測試mniDocBench 1.5以88.8分領跑。特別在性價比維度,與GPT-5.2(xhigh)相比,K2.5在保持性能逼近的同時將使用成本降低顯著。
視覺編程能力成為重要創新點。基于15萬億"視覺+文本"混合數據單元的預訓練,模型具備圖像視頻轉代碼能力。用戶上傳錄屏即可自動重建網頁,通過簡單對話就能生成包含專業動效的前端界面。在內部測試中,多語言環境下的代碼構建、調試、重構等全流程任務完成度顯著提升。
針對企業級應用場景,K2.5開發了四種運行模式:快速模式提供即時響應,思考模式擅長復雜問題拆解,Agent模式支持PPT/Excel等專業文檔生成,集群模式則專攻大規模并行任務。實際案例顯示,模型可同時處理100個細分領域的YouTube創作者分析,或基于單張照片生成全球婚禮旅行互動網頁。
辦公自動化領域實現重要突破。模型能解析萬字論文級輸入,直接生成包含數據透視表、LaTeX公式的專業文檔。在內部生產力測試中,辦公輸出質量較前代提升59.3%,多步驟工作流表現提升24.3%。典型應用包括自動生成分鏡腳本表格、提取加密PDF數據、構建財務模型等高密度任務。
同步推出的Kimi Code編程產品支持主流IDE集成,提供圖像視頻輸入接口,可自動遷移現有技能至新環境。API定價策略顯示,輸入服務每百萬token收費4元,輸出服務21元,緩存輸入低至0.7元。該模型已在Hugging Face和魔搭社區開放下載,提供完整的技術文檔和開發工具包。
國際技術社區對K2.5給予高度評價。FireworksAI首席技術官指出其融合了開源領域最先進的推理、視覺和長上下文處理能力;AI工程師0xSero分享了使用模型創建網站的成功案例;KEA Research創始人則認為該技術展現出改變行業格局的潛力。這些反饋印證了模型在技術先進性和應用落地性方面的雙重突破。











