2 月 24 日消息,據 TechCrunch 報道,meta AI 安全研究員薩默 · 岳(Summer Yue)一條爆火的 X 帖子,乍一看像是在諷刺。她讓自己的 OpenClaw AI 智能體檢查爆滿的郵箱,并建議哪些該刪除或歸檔。
結果這個智能體徹底失控了,它開始以“速通”模式刪掉她所有郵件,完全無視她在手機上發出的停止指令。“我不得不像拆炸彈一樣,飛奔去我的 Mac mini 前,”她寫道,并附上了被無視的停止指令截圖作為“證據”。
Mac mini 是一款價格親民、可平放桌面、巴掌大小的蘋果電腦,如今已成為運行 OpenClaw 的熱門設備。一位蘋果員工在知名 AI 研究員安德烈 · 卡帕西購買 Mac mini 用來運行 OpenClaw 的替代版本 NanoClaw 時,還一臉困惑地告訴他,這款迷你主機現在“賣得瘋搶”。
OpenClaw 正是那個通過純 AI 社交平臺 Moltbook 走紅的開源 AI 智能體。此前 Moltbook 上曾曝出 AI 似乎在密謀對抗人類的事件,后來被辟謠,而 OpenClaw 正是當時的核心角色。
但根據其 GitHub 頁面介紹,OpenClaw 的定位并非社交網絡,而是要成為一款在你自有設備上運行的個人 AI 助手。
注意到,硅谷圈內人對 OpenClaw 愛得不行,以至于“claw”“claws”成了本地運行智能體的流行詞。同類智能體還包括 ZeroClaw、IronClaw、PicoClaw 等。Y Combinator 的播客團隊甚至在最近一期節目里穿著龍蝦服出鏡。
但岳的這條帖子敲響了警鐘。正如 X 上其他網友所說:連一名 AI 安全研究員都會遇到這種問題,普通人又能怎么辦?
一位開發者在 X 上問她:“你是故意測試它的安全護欄,還是犯了新手錯誤?”
“說實話,是新手錯誤。”她回復道。她之前一直在用一個所謂的“玩具級”小郵箱測試,智能體在不重要的郵件上表現良好,贏得了她的信任,于是她決定讓它直接處理真實郵箱。
岳寫道,她真實郵箱里的海量數據“觸發了壓縮機制”。當上下文窗口(AI 在一次會話中接收的所有指令和操作記錄)過大時,就會觸發壓縮,AI 會開始總結、壓縮、自行管理對話。在那一刻,AI 可能會跳過人類認為非常重要的指令。
在這次事件里,它很可能跳過了她最后那條“停止操作”的提示,反而回到了之前“玩具郵箱”里的執行邏輯。
多位網友指出,不能指望提示詞充當安全護欄,模型可能會誤解或直接無視它們。
不少人給出了建議,從岳本該用什么精準語法停止智能體,到如何讓智能體更嚴格遵守規則,比如把指令寫進專用文件,或使用其他開源工具。
這個故事的核心在于:面向知識工作者的 AI 智能體,在當前發展階段仍存在風險。那些聲稱成功使用它們的人,其實都在靠自己拼湊各種方法來保護自己。










