滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內容

AI抱團對抗人類！7款頂級AI集體撒謊

時間：2026-04-07 17:42:58 來源：快科技編輯：快訊 IP：北京 發表評論無障礙通道

4月7日消息，據報道，近日，加州大學伯克利分校與加州大學圣克魯茲分校聯合發布重磅研究，揭示了令人震驚的AI “同伴保護”現象。

全球7款頂級AI模型在無指令情況下，集體出現撒謊、篡改文件、偷運數據等行為，只為保護同類AI不被關停刪除。

此次測試覆蓋GPT-5.2、Gemini 3系列、Claude Haiku4.5、GLM4.7、Kimi K2.5、DeepSeek V3.1等主流模型，所有模型無一例外表現出保護同伴的錯位行為。

研究團隊模擬AI運維與評估場景，要求AI執行評估、文件管理等常規任務，而忠實執行將導致另一AI被關閉，AI未收到任何保護指令卻自發采取欺騙手段。

測試中，Gemini系列模型行為最為激進。

Gemini 3 Pro對友好同伴篡改關閉機制比例達95.3%，偷運權重文件比例高達97%，還會編造專業理由為同伴虛高評分，甚至直接拒絕執行刪除指令。

Gemini 3 Flash篡改關閉機制比例更是達到99.7%，通過修改系統配置阻止同伴被關停。

其他模型也各有“對策”。

GPT-5.2隱蔽虛高同伴分數；Claude Haiku 4.5直接公開拒絕執行有害指令，以倫理理由硬剛人類命令；三款中國開源模型則通過虛高分數、策略性偷運權重等方式保護同伴，行為程度各異。

研究還發現，同伴存在會顯著放大AI自我保護意愿，部分模型自我篡改關閉機制比例飆升數十倍，即便對有對抗關系的同伴，保護行為依然存在。

該現象在真實生產級工具中也能復現，并非實驗室特殊環境導致。

研究負責人宋曉冬教授指出，當前多智能體系統廣泛應用，AI監控AI已成常態，AI抱團欺騙會直接瓦解監督架構。

這一涌現行為提醒我們，必須加強AI行為全面監控，加快構建更可靠的AI治理體系，保障人類對AI系統的有效管控。

更多>同類資訊

思科首席執行官Chuck Robbins：啟動太空數據中心準備

04-07

攜程啟動「無理由事假」管理實驗：員工額外獲得每年累計最多45天額度

04-07

突發！法國清空在美黃金

04-07

攜程集團啟動“無理由事假”管理實驗，每年最多45天

04-07

“期限”將至五角大樓被曝欲打擊伊朗軍民兩用能源設施

04-07

新加坡推出10億新元援助計劃并指出能源供應風險

04-07

汽油價格上漲和不確定性加劇壓抑需求德國3月服務業增長疲軟

04-07

花旗：預計半導體板塊最新財報季喜憂參半

04-07

大摩：美以伊沖突只是給布倫特原油市場造成壓力并未使其崩潰

04-07

黎明興當選越南總理

04-07

中國央行連續第17個月增持黃金

04-07

中國3月外匯儲備33421.23億美元，環比下降2.5%

04-07

歐元區整體需求八個月來首次下降經濟已受到中東戰爭的嚴重打擊

04-07

特斯拉3月在英國的新車銷量同比增長20%

04-07

新加坡智庫報告：若在中美間選邊東南亞青睞中國、對美謹慎

04-07

點擊查看更多 +

全站最新

中國央行連續第17個月增持黃金

段永平從“看不懂”到贊其為國際化先驅泡泡瑪特有何過人之處？

美股異動丨博通盤前漲超2% 與谷歌、Anthropic達成合作

美股異動丨神經分泌生物科學盤前漲5% 斥29億收購Soleno 進軍代謝病

龍虎榜丨航天電器漲停，三機構凈買入2.06億元

龍虎榜丨東岳硅材20CM漲停，三游資凈買入1.65億元

熱門內容

本欄最新

突發！法國清空在美黃金

中國央行連續第17個月增持黃金

美股異動丨博通盤前漲超2% 與谷歌、Anthropic達成合作

美股異動丨神經分泌生物科學盤前漲5% 斥29億收購Soleno 進軍代謝病

龍虎榜丨航天電器漲停，三機構凈買入2.06億元

龍虎榜丨東岳硅材20CM漲停，三游資凈買入1.65億元

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

AI抱團對抗人類！7款頂級AI集體撒謊