岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

谷歌、OpenAI讓旗下AI玩《精靈寶可夢》，衡量真正實力

時間：2026-01-25 17:44:14 來源：IT之家編輯：快訊 IP：北京 發表評論無障礙通道

1 月 25 日消息，據科技媒體 Tom's Hardware 今天報道，當今時代我們有無數種跑分測試和評測方法來衡量 AI 的聰明程度與能力，但最近一種相對小眾的測試方法也在 AI 圈內引發關注。

目前，谷歌、OpenAI 和 Anthropic 等 AI 巨頭正在讓自家模型游玩經典的《精靈寶可夢》系列游戲，以此來評估 AI 性能表現。

Anthropic 公司 AI 部門負責人 David Hershey 對此表示：“《精靈寶可夢》之所以能吸引機器學習社區關注，是因為它不像《Pong》等簡單游戲那樣受限。這種游戲對電腦程序來說非常具有挑戰性”。

Hershey 從去年開始在 Twitch 平臺進行直播，每天的日常就是用公司自產模型 Claude 玩《精靈寶可夢》。這名負責人平時的工作就是幫助客戶部署 AI，因此他開直播本質上也是在測試模型。

這名負責人給自家 AI 直播游戲的做法也啟發了不少自由開發者，他們也陸續搞了“Gemini 玩《寶可夢》”“GPT 玩《寶可夢》”等類似的直播節目。

后來，這些直播甚至被谷歌和 OpenAI 注意到，開發團隊有時還會客串直播間親自調整模型參數，在官方力量注入下，Gemini 和 GPT 已經成功通關了 Gam Boy 時代的《寶可夢藍》，目前已在挑戰續作；而 Claude 至今還沒打通任何一個版本。

至于為何要用《寶可夢》評估 AI 性能？Hershey 對此解釋道：“因為它給我們提供了直觀的方法觀察模型表現，還能用量化指標評估性能”。

通常來講，玩家在《寶可夢》系列游戲中需要升級、訓練已有 / 剛抓的寶可夢，還要打敗道館館主來捕捉新的寶可夢。這種游戲流程并非線性，而是充滿著判斷和取舍。

而且，玩家還要經常在游戲中做出選擇：是先冒險挑戰強大的訓練家以獲取珍稀寶可夢，還是穩扎穩打造出一支實力均衡的隊伍。

顯然，人類非常擅長做此類決策，這也是游戲的樂趣所在，但對于 AI 來說，這是一場關乎邏輯推理、風險評估以及長期規劃能力的綜合考驗。

因此研究人員會深入剖析 AI 在游戲里的決策方式，深入理解模型的能力邊界。

Hershey 還會將 AI 玩《寶可夢》的結果分享給客戶以改進控制框架（注：harness），幫助他們提升算力使用效率，讓模型更高效運轉。

更多>同類資訊

國產AI視頻新模型Seedance2.0來襲，技術躍升下行業規則待重塑

02-12

蘋果iOS 26.3正式版發布：支持與安卓換機傳輸新增天氣壁紙等功能

02-12

網易丁磊：AI重塑游戲業格局整合能力成新入局者難以跨越的門檻

02-12

蘋果新版Siri開發再遇波折：多項AI新功能或延遲至下半年發布

02-12

蘋果Siri升級再遇波折：測試問題致發布延期，部分功能或延至9月

02-12

老字號數字化轉型多渠道觸網破局“弱運營”需補人才短板

《報告》指出，截至2024年底，北京274家老字號企業普遍通過多種數字化渠道實現觸網，不僅積極入駐主流電商平臺和本地生活服務平臺，還廣泛運營自有公眾號、服務號、官方網站等私域陣地，整體線上觸達率已超過90%。…

02-12

央視《新聞聯播》曝光小米新進展：HyperOS車機系統或于玄戒芯片成功運行

IT之家對比發現，這三款終端設備預計屬于小米品牌，中間的平板采用劉海屏設計，預計為小米平板 7 Ultra。值得一提的是，小米平板 7Ultra 發布于去年 5 月，首發搭載玄戒 O1 旗艦處理器。該平板…

02-12

雷軍宣布初代小米SU7收官，新一代SU7多地亮相并迎核心升級

直播中，雷軍帶領觀眾“云參觀”小米汽車工廠交付中心、科技展廳及專屬定制中心，并正式宣布初代小米SU7量產收官，同時詳細披露新一代SU7的核心升級、實車展示計劃及春節期間的車主關懷舉措。據介紹，新一代SU7在…

02-12

意圖驅動時代來臨：手機App將告別“主動打開” 淪為AI調用的“數字管道”？

盡管目前在多步驟規劃上成功率仍有衰減，但它證明了：在App之上，已經可以建立一層新的執行結構。這驗證了界面層接管的可能性，但在當前30 TOPS的端側算力瓶頸下，跨應用操作仍面臨延遲（約3秒）與成功率（約50…

02-12

科大訊飛發布星火X2大模型推理性能提升50% 星辰Agent平臺智能體超130萬

訊飛方面介紹，星火X2在實現通用能力全面升級的同時，更加專注于教育、醫療、汽車、智能體等高專業性、高體驗性場景，致力于為這些領域提供領先、可靠的技術方案與支撐。當前智能體數量已經超過130萬，作為企業級智能…

02-12

科大訊飛智能語音及AI技術賦能多行業開放平臺聚超千萬伙伴共筑生態

證券日報網訊 2月11日，科大訊飛在互動平臺回答投資者提問時表示，訊飛智能語音及人工智能技術已經廣泛應用于各行各業，目前，訊飛開放平臺已鏈接超過千萬的合作伙伴共建人工智能生態，且時刻更新、增加，不便于一一確認…

02-12

新小米SU7展車到店！外觀內飾配置全面升級，續航最長835km引期待

在懸架系統方面，Pro與Max車型均標配雙腔空氣懸架和CDC減振器，顯著提升了行駛的穩定性與舒適性。續航方面，新小米SU7的各版本均有顯著提升：標準版續航達720公里，Pro版續航902公里，Max版續航更是…

02-12

初代小米SU7落幕，新一代SU7攜安全智駕新設計強勢登場！

2月10日晚，小米集團創始人、董事長兼CEO雷軍在一場直播中宣布，初代小米SU7的最后一輛已下線并正在運輸，標志著該車型的正式停產。這一消息不僅引發了行業內的廣泛關注，也讓消費者對小米汽車未來的發展充滿期待。…

02-12

小米YU7現身美國公路引猜測，Rivian R2或將其作競品研究？

最近，有網友在美國加州5號州際公路上，拍到了一輛掛著伊利諾伊州“制造商測試牌照”的小米YU7 Max。這事兒聽著就新鮮，畢竟這車壓根沒拿到在美國銷售的入場券。照片傳回國內，立馬炸開了鍋，連雷軍都親自下場回應。

02-12

嵐圖2026年車型大爆發！多款新車來襲，中高端市場再添勁敵

02-12

點擊查看更多 +

全站最新

奔馳將推全新入門車型：SUV與MPV風格融合 2028年亮相填補市場空白

美股三大指數小幅收跌，谷歌、微軟跌超2%，中概指數跌0.65%

老字號數字化轉型多渠道觸網破局“弱運營”需補人才短板

華為智能生活館青島啟幕：以科技為筆繪就李滄智慧生活新畫卷

小米YU7現身美國公路引猜測，Rivian R2或將其作競品研究？

豐田純電漢蘭達登場：超長軸距大空間，續航快充外放電，配置亮點多

熱門內容

本欄最新

老字號數字化轉型多渠道觸網破局“弱運營”需補人才短板

小米YU7現身美國公路引猜測，Rivian R2或將其作競品研究？

嵐圖2026年車型大爆發！多款新車來襲，中高端市場再添勁敵

蔣大為2026馬年獻聲《回家過年》溫潤嗓音唱響團圓喚醒游子歸鄉情

廣汽集團2025年報：科技轉型加速，前沿成果引領未來增長新機遇

Seedance 2.0爆火出圈：視頻生成突破背后，AGI時代加速來臨？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.