2 月 24 日消息,據(jù) TechCrunch 報道,meta AI 安全研究員薩默 · 岳(Summer Yue)一條爆火的 X 帖子,乍一看像是在諷刺。她讓自己的 OpenClaw AI 智能體檢查爆滿的郵箱,并建議哪些該刪除或歸檔。
結(jié)果這個智能體徹底失控了,它開始以“速通”模式刪掉她所有郵件,完全無視她在手機(jī)上發(fā)出的停止指令。“我不得不像拆炸彈一樣,飛奔去我的 Mac mini 前,”她寫道,并附上了被無視的停止指令截圖作為“證據(jù)”。
Mac mini 是一款價格親民、可平放桌面、巴掌大小的蘋果電腦,如今已成為運(yùn)行 OpenClaw 的熱門設(shè)備。一位蘋果員工在知名 AI 研究員安德烈 · 卡帕西購買 Mac mini 用來運(yùn)行 OpenClaw 的替代版本 NanoClaw 時,還一臉困惑地告訴他,這款迷你主機(jī)現(xiàn)在“賣得瘋搶”。
OpenClaw 正是那個通過純 AI 社交平臺 Moltbook 走紅的開源 AI 智能體。此前 Moltbook 上曾曝出 AI 似乎在密謀對抗人類的事件,后來被辟謠,而 OpenClaw 正是當(dāng)時的核心角色。
但根據(jù)其 GitHub 頁面介紹,OpenClaw 的定位并非社交網(wǎng)絡(luò),而是要成為一款在你自有設(shè)備上運(yùn)行的個人 AI 助手。
注意到,硅谷圈內(nèi)人對 OpenClaw 愛得不行,以至于“claw”“claws”成了本地運(yùn)行智能體的流行詞。同類智能體還包括 ZeroClaw、IronClaw、PicoClaw 等。Y Combinator 的播客團(tuán)隊甚至在最近一期節(jié)目里穿著龍蝦服出鏡。
但岳的這條帖子敲響了警鐘。正如 X 上其他網(wǎng)友所說:連一名 AI 安全研究員都會遇到這種問題,普通人又能怎么辦?
一位開發(fā)者在 X 上問她:“你是故意測試它的安全護(hù)欄,還是犯了新手錯誤?”
“說實(shí)話,是新手錯誤。”她回復(fù)道。她之前一直在用一個所謂的“玩具級”小郵箱測試,智能體在不重要的郵件上表現(xiàn)良好,贏得了她的信任,于是她決定讓它直接處理真實(shí)郵箱。
岳寫道,她真實(shí)郵箱里的海量數(shù)據(jù)“觸發(fā)了壓縮機(jī)制”。當(dāng)上下文窗口(AI 在一次會話中接收的所有指令和操作記錄)過大時,就會觸發(fā)壓縮,AI 會開始總結(jié)、壓縮、自行管理對話。在那一刻,AI 可能會跳過人類認(rèn)為非常重要的指令。
在這次事件里,它很可能跳過了她最后那條“停止操作”的提示,反而回到了之前“玩具郵箱”里的執(zhí)行邏輯。
多位網(wǎng)友指出,不能指望提示詞充當(dāng)安全護(hù)欄,模型可能會誤解或直接無視它們。
不少人給出了建議,從岳本該用什么精準(zhǔn)語法停止智能體,到如何讓智能體更嚴(yán)格遵守規(guī)則,比如把指令寫進(jìn)專用文件,或使用其他開源工具。
這個故事的核心在于:面向知識工作者的 AI 智能體,在當(dāng)前發(fā)展階段仍存在風(fēng)險。那些聲稱成功使用它們的人,其實(shí)都在靠自己拼湊各種方法來保護(hù)自己。










