深夜,OpenAI悄然發布了一款名為GPT-5.4的新模型,引發科技圈廣泛關注。這款模型的最大亮點在于首次實現了原生電腦操控能力,無需借助外部框架或適配層,可直接通過識別屏幕內容、模擬鼠標點擊和鍵盤輸入,像人類用戶一樣操作桌面環境中的各類軟件。這一突破性進展被視為AI領域的重要分水嶺,標志著智能體技術從“對話交互”向“任務執行”的跨越。
實測顯示,GPT-5.4在MacBook設備上展現了驚人的操作能力。用戶只需通過自然語言指令,模型即可調起日歷應用設置提醒、打開特定APP播放節目、操作計算器完成復雜計算,甚至更換電腦壁紙或調用終端執行代碼。在OSWorld-Verified基準測試中,該模型以75.0%的成功率超越人類平均水平(72.4%),成為首個在真實桌面環境中表現優于普通用戶的通用AI模型。這一數據對比GPT-5.2的47.3%成功率,凸顯了其操控能力的飛躍式提升。
開源個人AI助手項目OpenClaw的創始人Peter Steinberger指出,GPT-5.4的原生操控能力與OpenClaw的核心理念完美契合。該項目強調“AI不僅要聊天,更要干活”,而此前模型能力不足導致的任務卡頓、工具調用成本高等問題,在GPT-5.4身上得到根本解決。其100萬Token的上下文窗口支持長程任務保持,Tool Search機制按需調用工具定義,使OpenClaw的運行效率提升47%,API費用大幅降低。配合模型在編程、數學、文檔處理等領域超過83%人類專家水平的推理能力,OpenClaw從“自動補全工具”升級為真正的“賽博秘書”。
行業專家對GPT-5.4給予高度評價。HyperWriteAI首席執行官Matt Shumer認為這是“目前世界上最好的模型”,其在標準模式下的表現已超越此前專業版,編程能力更是“近乎完美無瑕”。Mercor AI首席執行官Brenda則斷言,該模型將超越頂尖咨詢公司、投行和律所的專業能力,覆蓋人類精英金領的所有工作場景。OpenAI科學家Sebastien Bubeck用梗圖展示其編程能力提升時,社區開發者實測發現,低端模型與GPT-5.4運行OpenClaw的體驗差距可達40%至95%,驗證了“模型即產品”的社區共識。
技術底層邏輯的切換引發更深層思考。過去AI競爭聚焦于模型參數規模,而GPT-5.4的發布將話題轉向“AI能做什么、能完成什么、能替代什么”。當模型操控電腦熟練度超越普通用戶,專業任務匹配行業專家時,個人AI員工從概念到現實的路徑已清晰可見。OpenClaw官方文檔已提供GPT-5.4接入配置方案,首批用戶正在社區分享使用體驗,一場由模型能力驅動的生產力革命正在悄然發生。











