近日,隨著人工智能生成內(nèi)容(AIGC)領(lǐng)域安全議題持續(xù)引發(fā)關(guān)注,國(guó)內(nèi)知名AI創(chuàng)作平臺(tái)哩布哩布AI(Liblib AI)主動(dòng)回應(yīng)社會(huì)關(guān)切,通過(guò)官方渠道發(fā)布專項(xiàng)整改公告。公告顯示,平臺(tái)在前期技術(shù)監(jiān)測(cè)中發(fā)現(xiàn),部分用戶通過(guò)組合復(fù)雜提示詞或使用規(guī)避性表達(dá)方式,可繞過(guò)現(xiàn)有審核機(jī)制生成不符合規(guī)范的內(nèi)容,暴露出系統(tǒng)在極端場(chǎng)景下的防御短板。
針對(duì)這一技術(shù)漏洞,平臺(tái)技術(shù)團(tuán)隊(duì)已完成針對(duì)性修復(fù),通過(guò)升級(jí)算法模型強(qiáng)化對(duì)異常語(yǔ)義的識(shí)別能力,同時(shí)對(duì)已發(fā)現(xiàn)的32條風(fēng)險(xiǎn)生成路徑實(shí)施永久封禁。為構(gòu)建長(zhǎng)效防護(hù)機(jī)制,哩布哩布AI同步啟動(dòng)審核體系升級(jí)工程,新增動(dòng)態(tài)語(yǔ)義分析模塊,將違規(guī)內(nèi)容攔截效率提升至98.7%,并建立每周攻防演練制度,模擬12類新型內(nèi)容攻擊場(chǎng)景進(jìn)行壓力測(cè)試。
在管理層面,該公司已啟動(dòng)全鏈條責(zé)任追溯機(jī)制,對(duì)內(nèi)容審核流程進(jìn)行顆粒度拆解,重點(diǎn)優(yōu)化初審-復(fù)審-抽檢三級(jí)管控體系。公告特別指出,將建立創(chuàng)作者信用積分制度,對(duì)多次觸發(fā)安全警戒的賬戶實(shí)施階梯式創(chuàng)作限制,從源頭降低違規(guī)內(nèi)容產(chǎn)出概率。
平臺(tái)安全負(fù)責(zé)人表示,此次整改不僅涉及技術(shù)迭代,更推動(dòng)企業(yè)建立"技術(shù)防御+人工審核+社會(huì)監(jiān)督"的三維治理框架。除內(nèi)部升級(jí)外,哩布哩布AI正式開通支持郵箱(support@liblib.ai),鼓勵(lì)用戶舉報(bào)違規(guī)內(nèi)容,承諾對(duì)有效線索提供者給予積分獎(jiǎng)勵(lì),形成全民參與的內(nèi)容治理生態(tài)。
行業(yè)觀察人士指出,隨著《生成式人工智能服務(wù)管理暫行辦法》深入實(shí)施,國(guó)內(nèi)AIGC平臺(tái)正經(jīng)歷從"野蠻生長(zhǎng)"到"規(guī)范發(fā)展"的關(guān)鍵轉(zhuǎn)型。哩布哩布AI的快速響應(yīng)與系統(tǒng)性整改,為行業(yè)提供了風(fēng)險(xiǎn)處置的參考樣本,預(yù)示著技術(shù)倫理建設(shè)將成為企業(yè)核心競(jìng)爭(zhēng)力的重要組成部分。










