AIPress.com.cn報道
OpenAI宣布推出一項新的公開漏洞賞金計劃(Safety Bug Bounty),專門用于識別人工智能系統中的濫用風險和安全問題。該計劃面向安全研究人員和倫理黑客開放,旨在發現傳統安全漏洞之外、可能對用戶造成實際危害的AI安全問題。
OpenAI表示,隨著人工智能技術快速發展,系統被濫用的方式也在不斷演變。新計劃的目標是通過外部研究者的參與,及時發現并修復潛在風險,確保AI產品在使用過程中的安全性。
此次推出的Safety Bug Bounty將與OpenAI現有的Security Bug Bounty計劃形成互補。后者主要針對傳統網絡安全漏洞,例如系統入侵或權限繞過,而新計劃則重點關注AI特有的安全場景,例如模型被操控、數據泄露或代理系統被惡意利用等問題。
根據OpenAI公布的規則,該計劃重點覆蓋三類風險。第一類是“代理型風險”(Agentic Risks),例如第三方提示注入攻擊(prompt injection),攻擊者通過惡意文本誘導AI代理執行危險操作或泄露敏感信息。研究者若能證明此類攻擊在至少50%的情況下可以復現,即可能獲得獎勵。
第二類是涉及OpenAI專有信息的安全問題,例如模型生成內容中泄露內部推理機制或其他公司專有數據。
第三類是賬戶與平臺完整性問題,包括繞過自動化檢測、操縱賬戶信任度、規避封禁機制等行為。
OpenAI指出,一些常見的“越獄”行為(jailbreak)并不在本次賞金計劃范圍內,例如僅僅繞過內容限制生成粗俗語言或公開可查的信息。不過,公司會不定期針對特定風險(如生物安全內容)開展私有漏洞賞金活動。
研究人員可以通過OpenAI的官方平臺提交相關報告,提交內容將由公司安全團隊和安全漏洞賞金團隊進行審核,并根據問題性質決定是否歸入安全漏洞或AI安全風險類別。
OpenAI表示,希望通過該計劃與全球安全研究者建立合作關系,共同提升人工智能系統的安全性,并推動構建更加可靠的AI生態。(AI普瑞斯編譯)











