岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

OpenAI發布GPT-5.4:推理編碼雙突破,知識工作表現直逼人類專家

   時間:2026-03-06 09:46:22 來源:互聯網編輯:快訊 IP:北京 發表評論無障礙通道
 

OpenAI 正式推出 GPT-5.4 系列模型,涵蓋面向 ChatGPT 和 API 的 Thinking 版本,以及專為復雜任務設計的 Pro 版本。這是該機構首次將前沿推理、編碼和智能體能力整合至單一模型中,旨在顯著提升專業領域的工作效率與準確性。

在 ChatGPT 應用中,GPT-5.4 Thinking 新增“思考過程預覽”功能。當處理復雜查詢時,模型會主動展示推理路徑,用戶可實時調整方向,減少反復溝通成本。該功能已上線網頁版和 Android 應用,iOS 版本即將推出。模型還強化了深度網絡研究能力,在處理高度專業化的查詢時,能更好地維持長上下文連貫性,確保答案始終保持相關性。

作為首個具備原生計算機操作能力的通用模型,GPT-5.4 支持通過截圖和鍵盤鼠標指令控制計算機,可完成跨應用的復雜工作流程。其上下文窗口容量擴展至 100 萬 tokens,使智能體能夠規劃、執行并驗證長期任務。在 Codex 和 API 層面,模型融合了 GPT-5.3-Codex 的編碼優勢,同時引入“工具搜索”功能,可高效調用各類工具完成多步驟任務。

專業領域測試顯示,GPT-5.4 在 44 個職業領域的 GDPval 基準中,83.0% 的項目達到或超越行業專家水平,較前代 GPT-5.2 的 70.9% 顯著提升。在投行級電子表格建模任務中,其平均得分達 87.3%,遠高于 GPT-5.2 的 68.4%。演示文稿評估中,68.0% 的評審者更偏好 GPT-5.4 生成的內容,認為其在美學設計、視覺變化和圖像運用方面表現更優。錯誤率方面,模型單個陳述的錯誤率降低 33%,完整回答中出現錯誤的可能性減少 18%。

計算機操作測試中,GPT-5.4 在 OSWorld-Verified 基準(通過截圖和鍵盤鼠標操作 PC 桌面)取得 75.0% 的成功率,超越人類表現的 72.4%,較 GPT-5.2 的 47.3% 提升顯著。在 WebArena-Verified 瀏覽器使用測試中,結合 DOM 和截圖驅動交互的成功率達 67.3%;Online-Mind2Web 測試中,僅憑截圖觀察即實現 92.8% 的成功率,遠超 ChatGPT Atlas 智能體模式的 70.9%。

視覺能力方面,GPT-5.4 在 MMMU-Pro 視覺理解與推理測試中取得 81.2% 的成功率,優于 GPT-5.2 的 79.5%。文檔解析測試 OmniDocBench 中,平均錯誤率降至 0.109,較前代的 0.140 進一步優化。編碼性能上,模型在 SWE-Bench Pro 基準中與 GPT-5.3-Codex 持平或表現更優,同時延遲更低。Codex 的“/fast”模式可提升 1.5 倍 token 處理速度,保持同等智能水平。

工具生態方面,啟用“工具搜索”功能后,模型在 Scale 的 MCP Atlas 基準測試中,總 token 消耗量減少 47%,同時維持準確率。Toolathlon 基準測試顯示,其能用更少的交互輪次實現更高準確率。網絡搜索能力在 BrowseComp 基準中提升 17 個百分點,GPT-5.4 Pro 版本更創下 89.3% 的新高。

安全性方面,模型延續 GPT-5.3-Codex 的防護措施,并引入“CoT 可控性”開源評估機制。測試發現,GPT-5.4 Thinking 控制思維鏈的能力較低,便于安全監控。定價策略上,API 每 token 價格高于 GPT-5.2,但更高的效率可降低總消耗。批量處理和 Flex 定價為標準費率的一半,優先處理為兩倍。

發布計劃顯示,GPT-5.4 Thinking 即日起向 ChatGPT Plus、Team 和 Pro 用戶開放,取代 GPT-5.2 Thinking。后者將在“遺留模型”部分保留至 2026 年 6 月 5 日。Enterprise 和 Edu 計劃用戶可通過管理員設置啟用早期訪問。GPT-5.4 Pro 面向 Pro 和 Enterprise 用戶開放。API 中,模型以 gpt-5.4 和 gpt-5.4-pro 名稱提供,Codex 支持 100 萬 tokens 上下文窗口的實驗性功能。OpenAI 強調,這是首個在 ChatGPT、API 和 Codex 同步推出的主流推理模型,未來 Instant 和 Thinking 版本將按不同節奏迭代。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 成年人在线观看网站 | 中文字幕视频一区 | 天天色天天射天天干 | 日皮网站 | 一级片免费在线观看 | 成人公开免费视频 | 国产精品免费在线播放 | 91偷拍精品一区二区三区 | 日韩一区二区在线观看 | wwwwww在线观看| 欧美三级视频在线观看 | www.久久国产| 久久久久成人精品 | 成人aaa视频 | 日韩精品国产精品 | 国产极品国产极品 | 欧美精品一区二区三 | 久久久久中文字幕亚洲精品 | 日本在线视频一区二区 | 国产精品久久久久久久av | 亚洲日本中文字幕在线 | 亚洲精品二区 | 国色天香av | 午夜在线观看影院 | 婷婷色视频 | 一级欧美一级日韩片 | 亚洲动漫在线 | 人人超碰97 | 欧美八区| 精品成人一区二区三区 | 亚洲免费久久 | 欧美日韩专区 | 麻豆国产91在线播放 | www.亚洲成人 | 成人久久久精品国产乱码一区二区 | 亚洲最新黄色网址 | 久久视奸 | 在线看免费av| 98视频在线 | 欧美片一区二区三区 | 欧美黄色网页 |