針對生成式AI內容安全引發的外界討論,哩布哩布AI于近日發布專項說明,表示已完成技術層面的全面排查與整改。此次自查重點針對復雜提示詞交互場景,發現原有審核機制在極端組合情況下存在識別盲區,導致少量生成內容偏離平臺規范標準。目前技術團隊已修復相關漏洞,并通過算法優化將內容安全閾值提升至新水平。
據企業技術負責人透露,本次整改涉及多維度策略升級:一方面強化了提示詞解析模型的語義理解能力,另一方面構建了動態風險評估體系,對可能觸發違規內容的組合模式進行實時監測。經壓力測試驗證,新系統對邊界場景的識別準確率提升至98.7%,較整改前提高23個百分點。
行業觀察人士指出,隨著AI生成技術的迭代,提示詞工程已成為內容治理的關鍵戰場。各平臺正通過建立攻防演練機制、完善安全評估標準等方式構建防護體系,哩布哩布此次的技術升級具有行業示范意義。數據顯示,近三個月該平臺用戶日均生成內容量突破2億條,復雜交互場景的治理難度呈指數級增長。
在監管協作層面,企業已建立常態化溝通機制,定期向主管部門報送技術安全報告。合規部門負責人表示,將根據最新監管要求持續優化治理框架,在用戶協議更新、年齡分級系統、內容溯源機制等方面推進落地,確保平臺運營始終處于合規軌道。
盡管面臨安全治理挑戰,哩布哩布AI仍保持業務增長態勢。最新運營數據顯示,其核心產品月活躍用戶數環比增長15%,創作者社區規模突破800萬。企業宣布將年度研發投入的35%專項用于內容安全建設,通過引入多模態審核技術、建設用戶舉報快速響應通道等措施,構建技術防護與社區共治相結合的治理生態。









