中國信息通信研究院近日宣布,將針對互聯(lián)網(wǎng)智能體領(lǐng)域啟動一項全新的測試評估工作。此次評估聚焦用戶普遍關(guān)注的核心問題,包括功能可信度、權(quán)限可靠性、操作透明度以及行為可干預(yù)性等,旨在通過科學(xué)嚴(yán)謹(jǐn)?shù)臏y試體系,推動行業(yè)健康發(fā)展。
據(jù)了解,該測試體系構(gòu)建了三大類評估框架,涵蓋16項核心指標(biāo)和70余個細分測試項。評估維度包括能力真實性驗證、權(quán)限管理可靠性審查以及行為控制有效性評估,通過多層次、多維度的測試方法,全面評估互聯(lián)網(wǎng)智能體的技術(shù)成熟度和安全合規(guī)性。測試將根據(jù)不同服務(wù)形態(tài)進行分類實施,確保評估結(jié)果的專業(yè)性和針對性。
首批測試評估工作已正式啟動,評估對象按兩類形態(tài)三種類型進行劃分。根據(jù)工作安排,2026年3月至4月將依次開展申報材料審核、技術(shù)指標(biāo)測試和專家評審等環(huán)節(jié)。最終評估結(jié)果計劃于2026年5月舉行的產(chǎn)業(yè)大會上向社會公布,為行業(yè)提供權(quán)威的技術(shù)參考和標(biāo)準(zhǔn)指引。











