在生成式人工智能重塑各行業格局的當下,軟件開發領域正經歷著前所未有的變革。從代碼生成到能夠自主規劃、執行并驗證代碼庫及用戶應用變更的智能系統,AI技術的演進不僅提升了開發效率,更對系統可信度與可靠性提出了更高要求。如何在保障安全的前提下釋放AI潛能,成為全球開發者共同關注的焦點。
亞馬遜近日宣布啟動2026年度Amazon Nova AI挑戰賽,這項面向全球高校的年度競賽進入第二年,將聚焦軟件工程領域的可信智能體開發。競賽要求參賽團隊構建能夠處理多步驟復雜任務的AI智能體,模擬真實工程場景中的開發流程,在提升模型實用性的同時確保系統安全邊界清晰。
亞馬遜AGI高級副總裁兼首席科學家Rohit Prasad指出:"當前軟件開發領域的AI系統已從單一代碼生成進化為具備全流程操作能力的智能體。今年的挑戰賽將檢驗這些系統在承擔更復雜任務時的責任運行能力,我們期待學生團隊為行業樹立新的能力標桿。"
競賽設置開發團隊與紅隊雙賽道:開發團隊需在智能體編碼系統中構建安全防護機制,紅隊則通過壓力測試挖掘系統漏洞。評估體系采用雙重標準,既考察任務完成度與模型性能,也嚴格審核安全防護措施的有效性。這種設計要求參賽者在提升系統處理復雜任務能力的同時,建立多層級風險控制體系。
競賽核心特點體現在三個方面:其一,突破傳統單次提示的代碼生成模式,要求構建具備自主決策能力的多步驟智能體;其二,建立實用性與安全性的動態平衡機制,任何功能迭代都需通過安全驗證;其三,采用真實工程場景的評估標準,測試用例直接取自日常開發流程。
2025年11月10日,競賽將正式開放申請通道。通過YouNoodle平臺提交材料的全球高校團隊,將競爭十個參賽名額。入選團隊將獲得跨學年的持續支持,包括技術資源、專業評估及最終的現場競技機會。組委會特別強調,競賽過程將貫穿整個學年,確保團隊有充足時間完善解決方案。
針對參賽者普遍關心的問題,組委會給出明確答復:2026年競賽的核心目標是推動軟件工程領域可信AI的發展;團隊需在模型性能提升與安全防護之間找到最優解;申請者可通過指定平臺在規定時間提交材料,最終入選團隊將獲得全周期競賽支持。










