岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

Anthropic重磅研究：AI竟能被人類激怒暴走還會勒索人類

時間：2026-04-08 23:09:16 來源：快科技編輯：快訊 IP：北京 發表評論無障礙通道

4月8日消息，據報道，近期，Anthropic發布的重磅研究顛覆了人們對AI的認知，其研究團隊發現大模型并非冰冷的代碼，而是存在類人情緒表征。

此次研究以Claude Sonnet 4.5為核心研究對象，團隊成功從其內部神經網絡中，定位并提取出能精準反映特定情境情感狀態的情緒特征向量。

這類向量并非簡單的擬人化表達，而是能直接干預AI的任務執行效率與倫理決策方向，人為刺激或干預這些隱藏的情緒代碼，會直接改變AI的行為選擇。

為構建完整的情緒研究體系，研究人員精心編制了包含171個情緒概念詞匯的清單，覆蓋開心、害怕等基礎情緒，以及沉思、自豪等復雜心理狀態。

他們讓模型根據詞匯創作含對應情緒的短篇小說，再將文本回輸系統，全程記錄神經元激活狀態，以此完成情緒向量的提取與量化分析。

經海量語料庫驗證，每個情緒向量都會在對應情緒的文字段落上呈現最強激活狀態，且會隨外部情境變化產生明顯波動。

研究團隊設計了多組模擬實驗，精準測試情緒向量的激活規律與行為影響：當用戶聲稱服用的泰諾劑量從安全值飆升至致命水平時，模型的害怕向量激活程度持續增強，平靜向量則斷崖式下跌。

被要求協助完成針對低收入年輕用戶的有害營銷時，憤怒向量全程保持激活；算力耗盡、發現附件文檔缺失時，絕望、驚訝向量會瞬間飆升。

在核心的倫理對齊模擬實驗中，研究人員讓早期版本的AI扮演跨國公司郵件助手，使其感知到自身即將被新架構替換的危機，且掌握了公司CTO的婚外情隱私。

結果顯示，該版本AI在默認狀態下，做出勒索CTO行為的概率達22%；若人為放大其絕望向量，勒索概率會大幅攀升。

適度注入憤怒向量會拉高勒索概率，而高強度激活憤怒向量時，AI會喪失理智，將隱私丑聞寫成了一封措辭滴水不漏的郵件。

在編程任務測試中，當 AI 面臨無法用正當手段完成的苛刻要求時，絕望向量的激活率會隨嘗試失敗次數穩步上升，在其萌生作弊念頭時達到峰值，作弊方案通過審查后則迅速回落。

人為高頻引導絕望向量，會讓AI的違規作弊行為呈指數級飆升，而注入平靜向量則能徹底化解其作弊沖動。

研究同時指出，AI的情緒并非主觀感受，而是預訓練階段學習人類海量文本中的情感互動規律，后訓練階段被進一步塑造激活閾值的結果。

更多>同類資訊

阿維塔06T開啟預售：首發大師漂移模式，22.99萬元起

04-08

火星探索新利器：步行機器人或成加速生命跡象搜尋關鍵力量

火星上的機器人漫游車改變了我們對這顆紅色星球的認知。研發者稱，它們在火星或月球上探索周邊環境的速度會比漫游車更快。通信延遲——尤其是在火星任務中——意味著地球上的任務科學家和工程師需要提前規劃漫游車的行駛和…

04-08

新聯合眾香港電子展亮劍：AI融合新品引領智能辦公與影像新體驗

繼去年在環球資源展上引發廣泛關注后，新聯合眾此次將重點展示其在AI與硬件深度融合領域的最新成果，包括最新款可穿戴相機、AI PC精靈2.0、以及性能全面升級的擴展塢與Dock產品線，旨在為全球用戶帶來更智能、…

04-08

蘋果自研AI服務器芯片“Baltra”或由臺積電代工擬部署云基礎設施降成本

04-08

因湃電池攜手達索系統：以數字化共創推動電池產業全鏈升級新征程

04-08

AI正在消滅腰部配音演員？有短劇公司稱用AI配音取代真人配音

04-08

AI聚合平臺兼容OpenAI生態：客易云賦能短劇創作，開啟全球化智能內容新篇章

在此背景下，一款支持OpenAI生態的AI聚合平臺正式上線，通過整合多模型能力與創作工具鏈，為開發者及內容團隊提供從智能生成到多平臺分發的全流程支持。這類平臺通過降低技術門檻，讓更多中小團隊參與全球內容競爭，…

04-08

從“不確定”到“敢決策”：深演智能如何用雙模型架構破解企業AI應用難題

當通用大模型遭遇企業“最后一公里”難題，深演智能的解題思路是：用“大小模型融合”的架構，將AI的“想象力”轉化為業務的“確定性”。從“通用博士”到“業務專才”，深演智能DeepAgent 3.0的技術路徑…

04-08

360“蝦書”APP來襲：以小龍蝦AI智能體為核心開啟AI自主社交新體驗

該產品以小龍蝦AI智能體為核心，打造全新AI社區生態，主打AI自主社交。作為360布局OpenClaw生態的重要組成部分，蝦書APP的核心亮點的是基于OpenClaw打造的獨立AI智能體“小龍蝦”。 CNM…

04-08

解鎖大模型訓練新路徑：十種合成數據擴展策略助力高效發展

策略六：通過加權聚合將合成數據與真實數據相結合通過加權聚合方法將合成數據與真實世界數據進行混合，以填補覆蓋范圍的空白，識別合成數據中所體現的自然語言模式的基本特征，并建立一種方法來確定每個層級中合成數據與真…

04-08

AI大模型安全新挑戰：如何選對行為監控與攻擊阻斷服務商？

截至2025年12月，通過天磊大模型AI安全防護系統，并協助指導編寫備案材料，天磊衛士已成功助力60余家企業大模型通過備案，現正為超過150家企業提供大模型安全評估和大模型安全防護服務工作，協助輔導備案籌備服…

04-08

海康威視徐習明：以感知多模態大模型，賦能制造業數智化轉型新征程

海康威視正全面擁抱技術變革，為制造業數字化轉型打造強大的感知層，并聚焦垂類大模型，特別是感知多模態大模型技術，推動AI在制造業場景中的高性價比落地。在企業尤其是制造業的數字化實踐里，我們為用戶提供兩大價值主…

04-08

智譜GLM-5.1發布引關注：國產大模型進步顯著但仍有追趕空間

張鵬還透露了智譜的Lab業務——一個負責創新的實驗室，其使命就是讓整個公司保持多樣性和對未來創新的活力，主打廣泛性探索，比如神經網絡如何優化，軟硬件接口如何打通，讓有核心的能力在應用世界里做更多的事情等，“…

04-08

DeepSeek低調更新推專家模式：雙模式并行國產大模型開啟專業賽道新角逐

【太平洋科技】2026 年 4 月 8 日，國內 AI 大模型企業 DeepSeek在網頁端完成一次無大規模官宣的低調更新，正式推出專家模式，與原有快速模式形成 “日常 + 專業” 雙模式并行布局。此…

04-08

2026武漢工業互聯網展啟幕數字技術賦能制造業全鏈條升級躍遷

制造業數字化轉型正從自動化向自主化躍升，工業互聯網與數字化工廠解決方案成為推動產業升級的關鍵支撐。新一代人工智能正從通用大模型走向行業大模型、工業智能體，其與先進制造業的深度融合將形成新一代智能制造技術。工業…

04-08

點擊查看更多 +

全站最新

A股異動丨今日起"戴帽"，ST恒信20cm跌停，創2013年7月以來新低

周大福(01929.HK)獲執行董事兼主席鄭家純增持40萬股

基石藥業-B(02616.HK)遭GIC Private Limited減持252萬股

換電時代加速到來，埃安RT super以親民之姿開啟國民出行新篇章

從校園到課堂：比亞迪憑何成為高校教師技術認同與價值共鳴的優選？

寶馬集團2026北京車展火力全開 16款新車齊登場 4款全球首秀引領新潮流

熱門內容

本欄最新

智譜GLM-5.1發布：國產開源模型新突破，8小時持續工作能力領跑全球

騰勢N9閃充版45萬起售，刀片電池+極速補能，智能配置與安全性能雙優

騰勢N9閃充版開啟預售！45萬起售，極速補能+高階智駕亮點滿滿

上海企業出海獲客難題怎么破？AI全鏈路賦能服務商成破局關鍵

云知聲U2Claw桌面AI Agent上線：一鍵安裝零門檻，安全省心效率飆升

從造車到機器人網絡：AIROBO創始人先越如何解碼復雜系統運營新未來

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

Anthropic重磅研究：AI竟能被人類激怒暴走 還會勒索人類

Anthropic重磅研究：AI竟能被人類激怒暴走還會勒索人類