近日,一家專注于端側AI模型研發的北京企業面壁智能,正式開源了其最新成果——MiniCPM-o 4.5模型。這款僅有90億參數的模型,憑借高密度架構與全模態交互能力,在行業內引發廣泛關注。其核心創新在于實現了“全雙工交互”技術,使模型能夠像人類一樣邊感知環境邊主動回應,為具身智能設備提供了更智能的“大腦”解決方案。
與傳統大模型不同,面壁智能從創業初期就聚焦端側場景。此次發布的MiniCPM-o 4.5,參數規模僅為行業頭部模型的1.34%至3.83%,卻集成了視覺理解、文檔解析、語音交互、聲音克隆等全模態能力。據研發團隊介紹,該模型突破了傳統單工交互的局限,通過全雙工技術實現了“邊看、邊聽、主動說”的實時響應能力。例如在視覺場景中,模型可根據畫面變化自主判斷交互時機,無需等待用戶指令即可輸出信息,大幅降低了對話延遲。
技術負責人姚遠用對講機與電話的比喻解釋技術差異:“傳統模型如同對講機,說話時無法接收信息,而全雙工模型則像電話,實現了輸入輸出的并行處理。”這種能力在具身機器人領域具有顛覆性意義。當前行業多聚焦運動控制與視覺-語言-動作(VLA)模型,但缺乏環境感知與主動交互能力。MiniCPM-o 4.5的加入,有望補齊機器人“理解-溝通-響應”的關鍵能力鏈。
公司CEO李大海將該模型視為技術范式升級的標志性產品。他指出,現有智能設備多為被動響應模式,而具備環境感知能力的主動式智能將催生全新應用場景。以汽車為例,搭載該模型的車輛可實時理解駕駛員狀態與路況變化,提供更精準的交互服務。這種轉變不僅需要模型具備多模態處理能力,更要求在算力受限的端側設備上實現高效運行。
支撐這種技術突破的,是面壁智能獨創的“密度法則”。該理論由首席科學家劉知遠提出,核心觀點是模型能力密度每100天就會翻倍增長。基于此,團隊通過持續優化算法架構,在極小參數規模下實現了性能躍升。李大海形象地將這種技術路線比作“大模型的光刻機”:“就像芯片制造追求晶體管密度,我們致力于在有限算力下壓縮更多智能。”
在商業化落地方面,面壁智能已與多家車企達成合作。聯合創始人雷升濤透露,團隊曾將車載遺留物品提醒功能的響應時間從4秒壓縮至1秒以內,這種極致優化正是端側模型的核心競爭力。他強調,端側場景對算力、內存的嚴苛約束,反而成為推動技術突破的動力源。當前模型已在汽車、手機等終端設備上實現穩定運行,驗證了技術路線的可行性。
對于AI技術演進方向,劉知遠認為將呈現兩大趨勢:一是專業能力持續強化,智能體將具備自主探索與跨領域協作能力;二是模型密度不斷提升,最終實現終端設備的普惠化部署。他預測,未來三到五年內,個人專屬模型將成為現實,這些具備自主學習能力的智能體將深度融入日常生活,成為真正的個性化助手。










