隨著人工智能技術逐步突破數字邊界,向物理世界深度滲透,人機交互正迎來一場范式革命。傳統以“一問一答”為核心的交互模式,在機器人、可穿戴設備等場景中逐漸暴露出響應滯后、感知割裂等問題,成為制約AI具身化發展的關鍵障礙。面壁智能聯合創始人兼CEO李大海在接受媒體采訪時指出,新一代交互形態已現端倪,但其全面落地需依賴云端與端側模型能力的協同進化。
清華大學計算機系教授、面壁智能首席科學家劉知遠從認知科學角度剖析了交互瓶頸的根源:人類通過聽覺、視覺、觸覺等多通道并行感知世界,而現有AI模型在多模態協同處理上仍存在顯著缺陷。例如,當用戶與智能設備對話時,設備往往無法同時處理視覺信息,導致交互自然度大幅下降。這種“單線程”處理模式限制了AI在復雜物理場景中的應用潛力,而全模態模型通過統一架構整合多感官數據,被視為破解這一難題的核心路徑。
在產業實踐層面,端側模型與硬件的融合正面臨技術權衡。李大海以智能手機場景為例說明,盡管當前頭部模型已能支持智能體完成部分復雜任務,但純云端方案存在隱私風險,端側部署則受限于算力與功耗。他透露,豆包手機雖實現了智能體模擬人類操作的功能突破,但真正邁向“自然交互”仍需解決輸入方式的變革——未來手機若能直接感知環境聲音與圖像,將大幅提升上下文同步能力,但這同時對硬件能效比提出更高要求。
相較于消費電子,汽車與機器人領域因資源條件更寬松,被視為全模態模型的優先落地場景。李大海特別強調,具身智能的當前瓶頸不在于機械本體,而在于“大腦”的認知能力。一旦模型在環境理解、任務規劃等方面取得突破,具身智能可能迎來指數級增長,類似ChatGPT引發的技術躍遷。劉知遠則預測,未來兩三年內,模型的專業能力與交互效率將同步提升,為多智能體協作奠定基礎。
面對技術迭代壓力,面壁智能選擇以模型能力密度為核心戰略。公司提出的“密度法則”指出,大模型的能力保鮮期僅約100天,行業需持續壓縮模型尺寸、提升單位算力效率。李大海將這一過程類比芯片行業的制程競賽,強調通過極致優化降低模型成本,推動其在邊緣設備上的普及。他同時指出,端側模型的商業化需構建開發者生態,單純依賴模型銷售難以實現百億級設備部署目標。
在競爭格局方面,李大海認為AI產業仍存在結構性機會。盡管科技巨頭加速布局,但創業公司可通過聚焦特定場景或技術細分領域建立優勢。“選擇廣闊賽道中的細分市場,或在小市場中做到頭部,都有巨大發展空間。”劉知遠則從技術演進角度預測,未來五年將見證智能體自主學習能力的爆發,而十年后,多智能體協同將催生群體智能的新形態。











