岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

新測試表明AI實際辦公準確率不足25%，但進展比想象更快

時間：2026-01-26 16:24:43 來源：IT之家編輯：快訊 IP：北京 發表評論無障礙通道

1 月 26 日消息，Digital Trends 24 日報道，一項由訓練數據公司 Mercor 發布的研究報告指出，當前主流人工智能模型在處理實際辦公室任務時表現不佳，最高準確率未超過 25%，研究表明 AI 在短期內難以替代人類知識工作者。

結果顯示，即使是市場上明顯處于領先地位的模型也無法達到 25% 的準確率，測試中成績領先的 Gemini 3 Flash 和 GPT-5.2，其準確率也僅為 24% 和 23%，而其他大多數受試模型的成績則不高于 20%。

為何 AI 會在“辦公測試”中失敗？Mercor 首席執行官 Brendan Foody 分析稱，AI 失敗的關鍵在于缺乏上下文處理能力。在真實辦公場景中，任務往往需要整合分散資源，比如查看日程，翻閱即時通訊記錄、閱讀 PDF 文檔和電子表格，而 AI 在跨源信息搜索與整理時容易混淆、出錯，要么干脆放棄。這導致目前的 AI 在辦公室里更像一個“不可靠的實習生”，而非成熟的專業人員。

附 APEX-Agents 準確率測試結果如下（排名從高到低）：

Gemini 3 Flash (High) - 24.0%

GPT-5.2 (High) - 23.0%

Claude Opus 4.5 (High) - 18.4%

Gemini 3 Pro (High) - 18.4%

GPT-5 (High) - 18.3%

Grok 4 - 15.2%

GPT-OSS-120B (High) - 4.7%

Kimi K2 Thinking - 4.0%

盡管表現有限，但 AI 的進步引人關注。Foody 指出，一年前同類測試的準確率僅為 5%-10%，如今已提升至 24%，AI 的學習速度遠超預期。不過，研究也強調，在掌握多任務處理和上下文切換之前，AI 尚無法勝任復雜的知識工作。

更多>同類資訊

上海交大發布光學領域垂直大語言模型Optics GPT

01-26

李想召開臨時全員會：不談業務談AI，押注人形機器人

01-26

商湯官宣旗下AI Agent“咔皮記賬”免費未來將推“AI Pro”模式

01-26

不再“失憶”:ChatGPT 升級臨時聊天模式，隱私對話也能記住你的偏好

01-26

?科研數據瞬秒變空白？德國教授因關閉 ChatGPT“數據授權”痛失兩年成果

01-26

AI 淪為犯罪工具:北韓黑客 Konni 利用人工智能生成惡意軟件攻擊區塊鏈工程師

01-26

千問正面回應“真人訂餐”質疑:0.1秒識別50種情緒，AI 也有“人情味”

01-26

物理世界的“數字光腦”：上海交大發布 Optics GPT，垂直大模型再下一城

01-26

機器人觸覺“大爆發”：全球首個超大規模跨本體視觸覺數據集“白虎-VTouch”發布

01-26

機器人感知進化：全球首個跨本體視觸覺大模型數據集“白虎-VTouch”震撼發布

01-26

誰是誰的“老師”？Mistral CEO 稱 DeepSeek 借鑒其架構引發技術圈熱議

01-26

智慧交通新守護：環網柜局放監測系統筑牢電力安全防線

為實現對環網柜局部放電的精準監測，智慧交通環網柜局放監測系統應運而生，該系統采用脈沖電流法作為核心檢測原理，為交通電力設施提供科學、可靠的運行保障。脈沖電流法通過檢測局部放電過程中產生的瞬時脈沖電流信號，實…

01-26

賈躍亭：FF EAI機器人首款產品已完成認證，即將啟動銷售

01-26

千問AI打電話訂餐真假難辨？千問回應：確實是AI在打電話

01-26

李想臨時召開線上公司全員會，不談汽車談AI

01-26

點擊查看更多 +

全站最新

客易云數字人直播：以AI技術賦能TikTok，開啟跨文化互動新篇章

品牌控價關鍵：破解一鏈多規格監測難題，筑牢市場價格防線

智慧交通新守護：環網柜局放監測系統筑牢電力安全防線

周鴻祎：2026將迎百億智能體時代 360“短劇智能體”賦能影視創作新可能

360周鴻祎：2026年“百億智能體”時代將至，中國如何把握機遇？

小身材大能量！埃斯頓ER20C緊湊型機器人：空間節省與高效作業的完美融合

熱門內容

本欄最新

小身材大能量！埃斯頓ER20C緊湊型機器人：空間節省與高效作業的完美融合

FF首款EAI機器人完成法規認證，戰略布局加速邁向美國頭部陣營

云知聲“山海·知音”2.0發布：聽懂鄉音、聊出溫度，AI交互再進化

印奇履新階躍星辰董事長，攜手團隊推進“AI+終端”戰略落地

比亞迪兌現承諾！10萬級車型實現城市記憶領航，智能駕駛再進階

每87秒下線一臺車身東風商用車D600智慧工廠開啟全球最大中重型商用車智造新篇

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.