近日,通用智能體領域迎來重要進展——MiniMax Agent正式推出桌面端兩項突破性功能更新,標志著智能體在復雜任務執(zhí)行和跨平臺協(xié)作能力上邁入新階段。此次升級聚焦"Pocket"與"Computer Use"兩大核心功能,通過深度整合即時通訊工具與系統(tǒng)級操作能力,重新定義了人機協(xié)作的邊界。
作為此次更新的核心亮點,"Pocket"功能(Beta版)實現(xiàn)了智能體與主流IM平臺的無縫對接。用戶可在飛書、微信、企業(yè)微信及Slack等通訊軟件中直接喚醒智能體,通過自然語言指令觸發(fā)任務執(zhí)行。該功能突破了傳統(tǒng)智能體需固定設備操作的限制,使任務處理具備移動化特性。例如,當用戶身處地鐵或會議現(xiàn)場時,僅需發(fā)送"查找上周的營銷方案"指令,智能體即可在其辦公電腦中完成文件定位、內(nèi)容提取及結果回傳的全流程操作,真正實現(xiàn)"口袋里的數(shù)字助手"定位。
另一項革命性功能"Computer Use"則賦予智能體完整的系統(tǒng)操作權限。通過模擬人類視覺識別與肢體操作,該功能可自主完成屏幕內(nèi)容解析、鼠標鍵盤控制等復雜動作。在技術實現(xiàn)層面,研發(fā)團隊突破了三項關鍵技術瓶頸:多模態(tài)感知融合技術使智能體能準確識別隱藏在深層菜單中的系統(tǒng)設置;跨應用流程編排引擎支持多軟件協(xié)同操作;隱私保護機制確保所有操作均在用戶授權范圍內(nèi)進行。這些技術突破使得智能體能夠處理傳統(tǒng)自動化工具難以觸及的任務場景。
在實際應用場景中,該功能展現(xiàn)出強大的任務處理能力。在人力資源場景中,智能體可自動讀取指定文件夾內(nèi)的簡歷文件,通過自然語言處理技術提取關鍵信息,再調(diào)用飛書API生成結構化分析報告,最終將包含候選人評分與面試問題的文檔鏈接回傳至對話窗口。整個過程無需人工干預,處理效率較傳統(tǒng)方式提升80%以上。在系統(tǒng)維護場景中,智能體能獨立完成"設置每日定時備份"這類跨應用操作,包括打開系統(tǒng)設置、定位存儲選項、配置定時任務參數(shù)等12個步驟,所有操作記錄均可通過截圖實時反饋給用戶。
此次功能更新標志著智能體從單一任務執(zhí)行向復雜工作流管理的進化。通過將自然語言交互、跨平臺協(xié)作與系統(tǒng)級操作能力深度整合,MiniMax Agent正在重新構建人機協(xié)作的范式。隨著更多企業(yè)級應用場景的解鎖,這種新型智能體有望在知識管理、流程自動化等領域引發(fā)新一輪效率革命。











