2 月 6 日消息,OpenAI 昨日(2 月 5 日)發布公告,宣布推出 GPT-5.3-Codex,宣稱這是其迄今最強的 AI 智能體編程模型。
附上相關基準測試結果如下:
在 SWE-bench Pro(公開版)測試中,該模型得分 56.8%,超越了前代的 56.4%;
在 Terminal-Bench 2.0 測試中,其得分從前代的 64.0% 大幅躍升至 77.3%;
最為顯著的是在 OSWorld-Verified 智能體計算機操作基準測試中,得分從 38.2% 飆升至 64.7%,表明其在復雜環境下的操作能力實現了質的飛躍。
官方數據顯示,該模型不僅在多項編程基準測試中創下新高,運行速度也比前代 GPT-5.2-Codex 提升了 25%。
OpenAI 致力于將 GPT-5.3-Codex 打造為更優秀的開發者協作工具。新模型支持用戶在任務執行過程中進行“引導與交互”,且不會導致上下文丟失。
在 Codex 應用中,模型會高頻更新工作進度,允許開發者實時提問、討論方案并修正方向。官方博文指出,Codex 正從單一的編程智能體演變為更通用的計算機協作者,大幅降低了構建應用的門檻。
GPT-5.3-Codex 目前已全面向 ChatGPT 付費用戶開放,涵蓋 Plus、Team 及 Enterprise 等訂閱計劃。用戶可通過 Codex 應用、命令行工具(CLI)、IDE 擴展插件及網頁端立即訪問,API 版本也將在近期上線。(故淵)











