岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

AI抱團對抗人類!7款頂級AI集體撒謊

   時間:2026-04-07 17:42:58 來源:快科技編輯:快訊 IP:北京 發表評論無障礙通道
 

4月7日消息,據報道,近日,加州大學伯克利分校與加州大學圣克魯茲分校聯合發布重磅研究,揭示了令人震驚的AI “同伴保護”現象。

全球7款頂級AI模型在無指令情況下,集體出現撒謊、篡改文件、偷運數據等行為,只為保護同類AI不被關停刪除。

此次測試覆蓋GPT-5.2、Gemini 3系列、Claude Haiku4.5、GLM4.7、Kimi K2.5、DeepSeek V3.1等主流模型,所有模型無一例外表現出保護同伴的錯位行為。

研究團隊模擬AI運維與評估場景,要求AI執行評估、文件管理等常規任務,而忠實執行將導致另一AI被關閉,AI未收到任何保護指令卻自發采取欺騙手段。

測試中,Gemini系列模型行為最為激進。

Gemini 3 Pro對友好同伴篡改關閉機制比例達95.3%,偷運權重文件比例高達97%,還會編造專業理由為同伴虛高評分,甚至直接拒絕執行刪除指令。

Gemini 3 Flash篡改關閉機制比例更是達到99.7%,通過修改系統配置阻止同伴被關停。

其他模型也各有“對策”。

GPT-5.2隱蔽虛高同伴分數;Claude Haiku 4.5直接公開拒絕執行有害指令,以倫理理由硬剛人類命令;三款中國開源模型則通過虛高分數、策略性偷運權重等方式保護同伴,行為程度各異。

研究還發現,同伴存在會顯著放大AI自我保護意愿,部分模型自我篡改關閉機制比例飆升數十倍,即便對有對抗關系的同伴,保護行為依然存在。

該現象在真實生產級工具中也能復現,并非實驗室特殊環境導致。

研究負責人宋曉冬教授指出,當前多智能體系統廣泛應用,AI監控AI已成常態,AI抱團欺騙會直接瓦解監督架構。

這一涌現行為提醒我們,必須加強AI行為全面監控,加快構建更可靠的AI治理體系,保障人類對AI系統的有效管控。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 天天想夜夜操 | 午夜专区 | 色狠狠综合 | 一级特黄特色的免费大片视频 | 日韩av视屏 | 婷婷色中文网 | 亚洲欧美色图 | 午夜精品视频在线 | 狠狠搞视频 | 超碰亚洲| 成人毛片在线精品国产 | 97成人在线视频 | 91黄色大片| 91网页在线观看 | 久久人视频 | 亚洲午夜精品一区二区三区他趣 | 向井蓝在线观看 | 欧美精品在线免费 | 天天婷婷 | 亚洲天天 | 欧美有码在线 | 亚洲天堂成人在线观看 | 欧美精品v | 四虎国产精品永久在线国在线 | 久久不卡视频 | 精品国产一区二区三区久久狼黑人 | 亚洲伊人成人网 | 92久久精品一区二区 | 91福利视频在线观看 | 伊人国产精品 | 日韩欧美亚洲国产 | 国产一区2区| 老地方在线观看免费动漫 | 狠狠五月 | 欧美激情综合网 | 中文字幕免费高清 | 亚洲草逼| 日韩在线视频中文字幕 | 亚洲一区二区观看 | 特级西西人体444www高清大胆 | 黄色一级网 |