4 月 14 日消息,MiniMax Agent 是一個能完成長程(Long Horizon)復(fù)雜任務(wù)的通用智能體,官方稱其能多步規(guī)劃出解決方案、拆解任務(wù)需求、并能執(zhí)行多個子任務(wù)從而交付最終結(jié)果。
MiniMax 官方今日發(fā)布了 MiniMax Agent 桌面端兩項更新:
Pocket 功能上線(Beta 版),支持接入飛書、微信、企業(yè)微信、Slack 等主流 IM 通訊軟件,讓桌面智能體可以隨身攜帶。用戶在 IM 中喚起 Pocket 并發(fā)送指令后,Agent 即在其電腦上執(zhí)行任務(wù),并將結(jié)果回傳至原對話。
Computer Use 功能上線,Agent 可以像人一樣看屏幕、操作鼠標(biāo)和鍵盤,直接操作用戶電腦上的軟件。本地安裝的設(shè)計工具、內(nèi)部的報表系統(tǒng)、藏在偏好設(shè)置中的開關(guān)、需要在多個應(yīng)用之間手動銜接的流程 —— 這些過去 Agent 難以觸達的任務(wù),現(xiàn)在都可以由它完成。
官方分享了多個使用場景,列舉如下:
遠程找文件:Agent 在用戶電腦的桌面上定位文件,找到后將文件直接回傳到原對話。用戶在地鐵上、會議中、出差途中都可以用同樣的方式取用本地文件,不需要打開電腦。
篩選簡歷并生成飛書文檔:Computer Use 負責(zé)在用戶電腦上讀取 Resume 文件夾中的本地文件并理解每份簡歷的內(nèi)容,飛書 CLI 負責(zé)將最終的候選人分析與面試題結(jié)構(gòu)化寫入飛書文檔。Agent 完成后將文檔鏈接回傳至原對話,用戶點擊即可查看。
操作本地應(yīng)用與系統(tǒng)設(shè)置:Agent 基于 Computer Use 打開系統(tǒng)設(shè)置、定位到“鎖定屏幕”面板、調(diào)整下拉菜單,隨后啟動客戶端執(zhí)行任務(wù),最后截圖回傳。整個過程可以在 IM 中完整查看 Agent 的每一步操作。
▲ 設(shè)置每日定時任務(wù)











