近日,人工智能領(lǐng)域掀起軒然大波——Anthropic公司因內(nèi)部配置失誤,意外泄露了其尚未發(fā)布的旗艦級AI模型“Claude Mythos”的核心信息。這款代號為“Capybara”的模型被描述為“代際躍遷”,在編程、學(xué)術(shù)推理和網(wǎng)絡(luò)安全等關(guān)鍵領(lǐng)域全面超越現(xiàn)有最強(qiáng)版本Claude Opus 4.6。然而,其強(qiáng)大的能力也伴隨著前所未有的安全風(fēng)險,甚至被公司內(nèi)部文件定性為“網(wǎng)絡(luò)安全領(lǐng)域的重大威脅”。
據(jù)泄露文件顯示,Anthropic正在重構(gòu)其模型矩陣,計(jì)劃引入一個全新的“Capybara”層級,定位高于現(xiàn)有旗艦Opus系列。該模型不僅體量更大、智能程度更高,運(yùn)行成本也將顯著增加。在性能測試中,Capybara在軟件編程、學(xué)術(shù)推理及網(wǎng)絡(luò)安全等場景的得分均大幅提升,被內(nèi)部稱為“迄今為止最強(qiáng)大的AI模型”。Anthropic發(fā)言人證實(shí)了這一方向,表示公司正在開發(fā)一款在推理、編程和網(wǎng)絡(luò)安全方面取得重大進(jìn)展的通用模型,并強(qiáng)調(diào)“鑒于其能力的強(qiáng)大,正在審慎推進(jìn)發(fā)布方式”。
然而,Capybara的強(qiáng)大能力也引發(fā)了嚴(yán)重安全擔(dān)憂。泄露的內(nèi)部草稿直言,該模型“在網(wǎng)絡(luò)攻擊能力方面遠(yuǎn)超任何其他AI模型”,可能催生大規(guī)模網(wǎng)絡(luò)攻擊,且破壞力將超出防御者的應(yīng)對能力。這一警告并非空穴來風(fēng):今年2月,OpenAI發(fā)布的GPT-5.3-Codex和Anthropic自身的Claude Opus 4.6均展現(xiàn)出識別軟件漏洞的能力,被業(yè)內(nèi)稱為“雙刃劍”。為應(yīng)對風(fēng)險,Anthropic計(jì)劃優(yōu)先向網(wǎng)絡(luò)安全防御機(jī)構(gòu)開放早期訪問權(quán)限,幫助其提前加固代碼庫。
此次泄露事件的根源在于Anthropic內(nèi)容管理系統(tǒng)(CMS)的配置缺陷。LayerX Security和劍橋大學(xué)的研究員發(fā)現(xiàn),該系統(tǒng)默認(rèn)將上傳的數(shù)字資產(chǎn)設(shè)為公開狀態(tài),除非用戶手動設(shè)為私密。這一漏洞導(dǎo)致近3000份未發(fā)布文件——包括圖片、PDF和音頻——暴露在公開可檢索的數(shù)據(jù)緩存中。Anthropic在聲明中將事件歸因于“人為錯誤”,并稱泄露材料為“考慮發(fā)布的內(nèi)容早期草稿”。
消息曝光后,社交平臺X(原Twitter)上掀起激烈討論。用戶TFTC諷刺道:“Anthropic用一次CMS配置錯誤證明了AI安全的重要性——3000份未發(fā)布文件泄露,其中就包括被內(nèi)部稱為‘最強(qiáng)大AI’的Capybara詳情。”另一用戶fardeen則關(guān)注模型的實(shí)際能力:“Claude現(xiàn)在能像人類一樣操作電腦——打開應(yīng)用、點(diǎn)擊按鈕、填寫表單,人類正逐步被移除出操作流程。”還有用戶Oliwier Makowski Trusz指出,根據(jù)泄露信息,Capybara的參數(shù)量達(dá)10萬億,將大幅拉開與其他模型的差距。
目前,Anthropic尚未公布Capybara的具體發(fā)布時間,但此次泄露已讓業(yè)界對其技術(shù)實(shí)力和安全風(fēng)險展開重新評估。隨著AI能力不斷突破,如何平衡創(chuàng)新與風(fēng)險,將成為所有科技公司必須面對的終極命題。











