AIPress.com.cn報(bào)道
在AI代理能力不斷增強(qiáng)的背景下,Apple研究團(tuán)隊(duì)將焦點(diǎn)轉(zhuǎn)向一個(gè)更具現(xiàn)實(shí)意義的問題:當(dāng)AI可以替用戶“操作電腦”時(shí),用戶到底愿意放權(quán)到什么程度?
該研究首先分析了9款現(xiàn)有代理系統(tǒng),包括Claude Computer Use Tool、OpenAI Operator、Project Mariner等,構(gòu)建出覆蓋“輸入方式”“行為可解釋性”“用戶控制”“心智模型”四大維度的體驗(yàn)框架。
研究指出,當(dāng)前AI代理設(shè)計(jì)普遍強(qiáng)調(diào)自動(dòng)化與執(zhí)行能力,卻未充分回答一個(gè)核心問題——用戶如何實(shí)時(shí)理解代理的決策邏輯。
在隨后的用戶實(shí)驗(yàn)中,20名參與者通過聊天界面與“代理”完成度假租賃與電商購物任務(wù)。實(shí)際上,所謂代理由研究人員人工模擬操作。
實(shí)驗(yàn)結(jié)果呈現(xiàn)出清晰趨勢(shì):
用戶希望看到代理在做什么,但不希望被迫逐步監(jiān)管
在探索型任務(wù)中容忍更高自主度
在執(zhí)行型任務(wù)中更強(qiáng)調(diào)精準(zhǔn)與一致
在涉及金錢或賬戶變更時(shí),強(qiáng)烈要求確認(rèn)機(jī)制
最具代表性的發(fā)現(xiàn)是,一旦代理在模糊選項(xiàng)下自行做出未說明的選擇,參與者普遍要求系統(tǒng)暫停并解釋理由。若代理悄然偏離原計(jì)劃,信任度迅速下降。
研究認(rèn)為,AI代理的關(guān)鍵挑戰(zhàn)并非能力不足,而是“黑箱決策”帶來的心理落差。當(dāng)系統(tǒng)代替用戶點(diǎn)擊、選擇、提交信息時(shí),任何未被解釋的假設(shè)都可能被視為風(fēng)險(xiǎn)。
這項(xiàng)研究為AI代理的產(chǎn)品化路徑提供了更明確方向:真正可落地的代理系統(tǒng),需要在自動(dòng)化與可控性之間找到動(dòng)態(tài)平衡,而非單純追求更強(qiáng)的自主執(zhí)行能力。(AI普瑞斯編譯)











