滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

OpenAI最強AI智能體編程模型：GPT-5.3-Codex登場，基準測試全面霸榜

時間：2026-02-06 16:01:17 來源：IT之家編輯：快訊 IP：北京 發表評論無障礙通道

2 月 6 日消息，OpenAI 昨日（2 月 5 日）發布公告，宣布推出 GPT-5.3-Codex，宣稱這是其迄今最強的 AI 智能體編程模型。

附上相關基準測試結果如下：

在 SWE-bench Pro（公開版）測試中，該模型得分 56.8%，超越了前代的 56.4%；

在 Terminal-Bench 2.0 測試中，其得分從前代的 64.0% 大幅躍升至 77.3%；

最為顯著的是在 OSWorld-Verified 智能體計算機操作基準測試中，得分從 38.2% 飆升至 64.7%，表明其在復雜環境下的操作能力實現了質的飛躍。

官方數據顯示，該模型不僅在多項編程基準測試中創下新高，運行速度也比前代 GPT-5.2-Codex 提升了 25%。

OpenAI 致力于將 GPT-5.3-Codex 打造為更優秀的開發者協作工具。新模型支持用戶在任務執行過程中進行“引導與交互”，且不會導致上下文丟失。

在 Codex 應用中，模型會高頻更新工作進度，允許開發者實時提問、討論方案并修正方向。官方博文指出，Codex 正從單一的編程智能體演變為更通用的計算機協作者，大幅降低了構建應用的門檻。

GPT-5.3-Codex 目前已全面向 ChatGPT 付費用戶開放，涵蓋 Plus、Team 及 Enterprise 等訂閱計劃。用戶可通過 Codex 應用、命令行工具（CLI）、IDE 擴展插件及網頁端立即訪問，API 版本也將在近期上線。（故淵）

更多>同類資訊

賈躍亭為還債回北京發布人形機器人：高點曬單已賣千臺

02-06

李想：全新理想L9是具身智能機器人的開山之作

02-06

Claude Opus 4.6和GPT-5.3-Codex同日發布，誰是編程之王？

02-06

首個信貸多模態評測基準背后的產業與學術對話：尋找金融領域的ImageNet

02-06

Gartner：2026年全球IT支出預計將達到6.15萬億美元，同比增長10.8%

02-06

可畫將品牌設計能力引入 ChatGPT

02-06

AI起草人工審核：X 引入 AI 撰寫 Community Notes

02-06

千問30億免單止于微信封禁

02-06

千問APP「春節30億大免單」正式上線：免單點奶茶，最多可得21張

02-06

蘋果 CEO 蒂姆·庫克暗示:全新 AI 硬件品類即將面世

02-06

全國首個 3 萬卡AI集群正式上線，萬億參數大模型再也不缺“口糧”了

02-06

?融資2.55億美元:AI實驗室Fundamental破繭而出，用Nexus模型重塑大模型分析能力

02-06

?Peloton 押注 AI 失敗：宣布裁員 11% 并深陷硬件增長困境

02-06

?OpenAI 發布 Frontier 平臺：打造“AI 同事”生態，加速企業級智能體落地

02-06

衣服也能變“機甲”？紅豆攜手中電科發布AI穿戴機器人：以后爬山逛街都有“外掛”了！

02-06

點擊查看更多 +

全站最新

江蘇永志半導體啟動IPO輔導備案，技術領先估值35億或成行業新星

大族數控港交所成功上市首掛漲幅達16.7% 總市值突破530億港元

牧原股份2月6日港交所主板上市，開盤上漲總市值突破2296億港元

春運出行更安心，“鷹眼守護”系統升級守護95億人次平安歸途

特斯拉接入CarPlay：有限讓步滿足用戶需求，難敵中國智能座艙硬實力

一圖看懂樂欣戶外(2720.HK)IPO

熱門內容

本欄最新

理想汽車二季度將發全新L9 Livis版：自研“馬赫100”芯片智能化程度大提升

2025年我國互聯網發展“加速跑”：普及率超80%，AI用戶破6億

2025年我國互聯網發展“新”意盎然：普及率超八成 AI應用加速滲透

比亞迪宋Ultra EV官宣！大空間配激光雷達，一季度上市引期待

國家超算互聯網核心節點在鄭上線，開啟全國算力一體化普惠新征程

智駕普惠趨勢下元戎啟行憑技術優勢穩居第二拓15萬級市場

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

OpenAI最強AI智能體編程模型：GPT-5.3-Codex登場，基準測試全面霸榜