谷歌于當(dāng)?shù)貢r(shí)間2月12日披露,旗下 AI 聊天機(jī)器人 Gemini 正遭遇大規(guī)模 “蒸餾攻擊”,攻擊者通過(guò)海量重復(fù)提問(wèn)誘導(dǎo)模型泄露內(nèi)部機(jī)制,其中單次攻擊的提示次數(shù)竟超10萬(wàn)次,引發(fā)行業(yè)對(duì)大模型安全的高度關(guān)注。據(jù)悉,這類(lèi)攻擊是通過(guò)反復(fù)試探 Gemini 的輸出模式與邏輯,試圖探測(cè)其核心內(nèi)部機(jī)制,最終實(shí)現(xiàn)克隆模型或強(qiáng)化自身 AI 系統(tǒng)的目的。
谷歌表示,攻擊主要由帶有商業(yè)動(dòng)機(jī)的行為者發(fā)起,幕后多為尋求競(jìng)爭(zhēng)優(yōu)勢(shì)的 AI 私企或研究機(jī)構(gòu),攻擊源遍布全球多個(gè)地區(qū),不過(guò)谷歌并未披露更多嫌疑方信息。谷歌威脅情報(bào)小組首席分析師約翰?霍特奎斯特指出,此次攻擊規(guī)模釋放出危險(xiǎn)信號(hào),這類(lèi)蒸餾攻擊或已開(kāi)始向中小企業(yè)的定制 AI 工具領(lǐng)域蔓延。
他將谷歌的遭遇比作 “煤礦里的金絲雀”,意味著大型平臺(tái)的安全危機(jī),正預(yù)示著整個(gè) AI 行業(yè)即將面臨的廣泛風(fēng)險(xiǎn)。谷歌強(qiáng)調(diào),蒸餾攻擊本質(zhì)上屬于知識(shí)產(chǎn)權(quán)盜竊,各大科技公司為研發(fā)大語(yǔ)言模型已投入數(shù)十億美元,模型內(nèi)部機(jī)制是核心專(zhuān)有資產(chǎn)。
盡管行業(yè)已部署識(shí)別和阻斷這類(lèi)攻擊的相關(guān)機(jī)制,但主流大模型服務(wù)面向公眾開(kāi)放的特性,使其從根本上仍難以規(guī)避此類(lèi)風(fēng)險(xiǎn)。此次攻擊的核心目標(biāo)是套取 Gemini 的 “推理” 算法,即其信息處理的核心決策機(jī)制。
霍特奎斯特發(fā)出警告,隨著越來(lái)越多企業(yè)訓(xùn)練包含內(nèi)部敏感數(shù)據(jù)的定制化大模型,蒸餾攻擊的潛在危害將持續(xù)擴(kuò)大,甚至可能導(dǎo)致企業(yè)沉淀多年的商業(yè)思維和核心知識(shí)秘密,通過(guò)這類(lèi)手段被逐步提取。










