OpenAI 發(fā)布公告為 ChatGPT 新增兩項(xiàng)高級(jí)安全防護(hù)措施,用以應(yīng)對(duì) AI 系統(tǒng)在對(duì)接網(wǎng)頁(yè)、外部應(yīng)用場(chǎng)景中日益凸顯的提示注入攻擊風(fēng)險(xiǎn),該類攻擊會(huì)被第三方利用誘導(dǎo) AI 執(zhí)行惡意指令或泄露敏感信息,新措施均建立在平臺(tái)現(xiàn)有沙箱機(jī)制、URL 數(shù)據(jù)外泄防護(hù)等多層安全體系之上。
此次推出的首個(gè)防護(hù)措施是Lockdown Mode(鎖定模式),這是面向高安全需求用戶的可選高級(jí)設(shè)置,并非面向普通用戶,核心通過(guò)嚴(yán)格限制 ChatGPT 與外部系統(tǒng)的交互方式降低數(shù)據(jù)外泄風(fēng)險(xiǎn)。該模式會(huì)確定性禁用或限制易被利用的工具能力,比如網(wǎng)頁(yè)瀏覽僅可訪問(wèn)緩存內(nèi)容,無(wú)強(qiáng)安全保證的功能將直接禁用。
目前該模式適用于 ChatGPT Enterprise、Edu、醫(yī)療和教師版,管理員可在工作臺(tái)設(shè)置中創(chuàng)建角色啟用,且能細(xì)粒度管控鎖定模式下可使用的外部應(yīng)用及具體操作;OpenAI 還計(jì)劃未來(lái)數(shù)月將該模式開(kāi)放給消費(fèi)者用戶,同時(shí) Compliance API Logs Platform 可輔助管理員實(shí)現(xiàn)應(yīng)用使用、數(shù)據(jù)共享的監(jiān)管審計(jì)。
第二項(xiàng)措施是在ChatGPT、ChatGPT Atlas 與 Codex中,為存在額外安全風(fēng)險(xiǎn)的功能統(tǒng)一標(biāo)注 標(biāo)簽,標(biāo)準(zhǔn)化風(fēng)險(xiǎn)提示方式。
OpenAI 表示,部分網(wǎng)絡(luò)相關(guān)能力雖能提升 AI 實(shí)用性,但存在尚未被行業(yè)防護(hù)措施完全解決的風(fēng)險(xiǎn),標(biāo)注標(biāo)簽?zāi)茏層脩羟逦獣燥L(fēng)險(xiǎn),自主決定是否使用,尤其適用于處理私密數(shù)據(jù)的場(chǎng)景。以 Codex 為例,開(kāi)發(fā)者開(kāi)啟其網(wǎng)絡(luò)訪問(wèn)權(quán)限時(shí),界面會(huì)顯示該標(biāo)簽,并明確告知啟用后的變化、潛在風(fēng)險(xiǎn)及適用場(chǎng)景,同時(shí)給出風(fēng)險(xiǎn)緩解建議。











