抓馬!向來標榜安全的Claude,竟然把自家模型泄露了!?
新模型代號“Mythos”,又叫“Capybara(卡皮巴拉)”,比當下Claude最強的Opus模型還大還強。
甚是離譜的是,這波曝光,甚至不是外部攻擊,而是一次權限配置失誤。
一篇Anthropic自家博客草稿,被錯誤設為公開,于是,這只“卡皮巴拉”就這么水靈靈地被全網圍觀了。
更讓人繃不住的是,CEO也沒能逃過這場風波,他的度假計劃,也被這位馬大哈員工公開到了網上??
而其中的一篇保密但沒保密成功的數據資料里,直接爆出了還在測試的秘密模型——Claude Mythos。
有網友在文章下架之前把A社的兩篇博客草稿保存了下來,這兩篇一篇管這個模型叫Mythos,另一篇則稱之為Capybara,但除了名稱之外,這兩篇草稿的其他內容基本一樣。
在泄露文件中,曾多次使用質的飛躍這種說法來形容Mythos,甚至據說比目前的最強模型Opus更大且更智能。
沒有概念沒關系,人家資料里直接拿對比說話了:
在具體能力上,相較于Claude Opus 4.6,Mythos在軟件編碼、學術推理和網絡安全等測試中的得分顯著更高。
不僅如此,泄漏文件中還提到,目前Anthropic已完成了對于該模型的相關訓練。
并且還說了這么一句話:
Claude Mythos,就是迄今為止公司開發過的最強大的AI模型!!!
嚯!比Opus4.6還強大的模型,何意味?
要知道,目前Claude主要有三款模型:分別是輕量級模型Haiku、中量級模型Sonnet,以及旗艦型模型Opus。
在具體表現上,不久前發布的Opus 4.6,在復雜長文本處理和推理能力上已經處在當前模型第一梯隊。
在GDPval-AA(一項評估金融、法律和其他領域經濟價值知識工作任務的性能指標上),Opus 4.6比GPT-5.2高出144個Elo!!!
如果真要像文件里所說的,Mythos能比Opus 4.6還強。
那么,這事兒還真就不太好說了。
反正我估計隔壁OpenAI真得瑟瑟發抖了...
奧特曼:原本以為大家還在一個量級里切磋,誰知道人家私下搞這一套秘密玩法啊??
安全風險讓A社自己都害怕Anthropic承認,其內容管理系統配置中的“人為錯誤”導致草稿博客文章變得可訪問。
按照A社的說法,這些材料屬于“考慮發布的內容的早期草稿”,也就是說早晚會公開,但因為泄露被提前了。
有網友銳評,因為有了Claude Code,導致被公開的文件更容易被發現,A社這波是被自己家的產品反噬了??
(有點太鯊人誅心了啊...)
事兒越鬧越大,再不站出來說兩句都不太好了。
人家A社發言人也承認了,他們確實正在訓練和測試一款新模型。
我們正在開發一款通用模型,它在推理、編碼和網絡安全方面都有顯著提升。
鑒于其強大的功能,我們正在謹慎地發布這款模型。按照行業慣例,我們正在與一小部分早期用戶合作測試該模型。我們認為這款模型是一次飛躍,也是我們迄今為止構建的最強大的模型。
由于該模型在代碼和網絡安全領域的能力遠超現有水平,甚至可能被用于發起大規模網絡攻擊,公司將其限制在極少數早期訪問客戶范圍內進行封閉測試。
這種分階段披露的做法是為了給網絡防御組織留出提前量,讓他們能夠利用模型的能力先行加固代碼庫,以應對未來可能出現的AI攻擊。
有人更是呼吁,這樣的模型無論如何都不應該公開,因為根本不存在絕對堅固的防御系統。
其實,目前已經有的Opus 4.6,就已經具備了發現生產代碼庫中此前未知漏洞的能力。
A社已經承認,這項功能具有雙重用途,這意味著它既可以幫助黑客,也可以幫助網絡安全防御者發現并修復代碼中的漏洞。
還有隔壁OpenAI,在發布GPT-5.3-Codex時,也稱其是根據“網絡安全準備框架”評定的首個“高能力”網絡安全相關任務模型,也是首個直接訓練用于識別軟件漏洞的模型。
也就是說,不管Anthropic還是OpenAI,它們最新一代的前言模型,都已經破了某個門檻,將帶來新的網絡安全風險。
不過也有人認為,泄露的信息并不等于100%的事實,無法排除炒作成分,所以還是拭目以待最終交付的產品究竟如何。











