滾動資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

清華傳奇姚順宇立功！全新Gemini一夜血洗編程

時間：2026-02-13 11:29:16 來源：新智元編輯：快訊 IP：北京 發(fā)表評論無障礙通道

新智元報道

編輯：桃子好困

剛剛，谷歌Gemini 3 Deep Think原地進(jìn)化！在Codeforces比賽中拿下全球第七，擊敗了人類選手。短短三個月，全方位刷爆SOTA。

猝不及防，谷歌DeepMind深夜又放大招了！

今天，Gemini 3 Deep Think重磅升級，幾乎刷爆全領(lǐng)域的SOTA，標(biāo)志著AI推理能力進(jìn)入了全新維度。

離職Anthropic入職谷歌的華人學(xué)者姚順宇參與了Gemini 3 Deep Think

這一次，在科學(xué)研究和硬核工程領(lǐng)域，Deep Think堪稱一個「最強大腦」。

它可以將草圖渲染成一個高保真、實用的3D筆記本電腦支架圖，并直接將其打印出來。

谷歌VP曬出這個副項目，最終的成品是這樣子的。

新版Deep Think的實力究竟有多恐怖？

在編程界，它刷出了3455 Elo的驚人分?jǐn)?shù)，達(dá)到世界冠軍級的水準(zhǔn)，沖入了Codeforces比賽人類TOP 10！

也就是說，全球只有7人擊敗了Gemini 3 Deep Think，一年前，最強o3也僅拿下2727 Elo。

在人類最后考試（HLE）上，Gemini 3 Deep Think刷新SOTA，拿下了48.4%的成績。

甚至，它在一夜之間讓最難的ARC-AGI-2基準(zhǔn)直接飽和，以84.6%新SOTA一騎絕塵。

左右滑動查看

與Gemini 3 Pro相比，Deep Think實現(xiàn)了全方位反超，并將Claude Opus 4.6、GTP-5.2直接踩在了腳下。

更令人震撼的是，Gemini 3 Deep Think的實戰(zhàn)表現(xiàn)。

羅格斯大學(xué)數(shù)學(xué)家Lisa Carbone在研究時，讓它審查一篇高深的物理數(shù)學(xué)論文。

結(jié)果，Deep Think竟發(fā)現(xiàn)了一個連人類同行評審，都遺漏的細(xì)微邏輯漏洞。

Gemini 3 Deep Think這波史詩級進(jìn)化，又讓某些人睡不著了。

目前，Google AI Ultra訂閱用戶即可在Gemini中體驗新版Deep Think。同時，首次通過API向部分研究人員、工程師和企業(yè)開放。

實力刷爆SOTA，奧賽金牌大滿貫

去年，Deep Think專門版成功解決了推理領(lǐng)域最艱巨的任務(wù)，在數(shù)學(xué)和編程世界錦標(biāo)賽中奪下金牌。

就在昨天，谷歌DeeoMind還做了一個預(yù)熱。

背靠初代Deep Think的「AI數(shù)學(xué)家」Aletheia可以獨立撰寫論文，證明了「Erd?s猜想」中多個難題。

不僅如此，Deep Think直接推翻了十年猜想，一舉攻克18大研究瓶頸。

而現(xiàn)在，迭代后的Deep Think已在多項高難度的基準(zhǔn)測試中刷新SOTA：

人類最后的考試（HLE）：設(shè)定了新標(biāo)桿，在不使用工具的情況下準(zhǔn)確率達(dá)48.4%；

ARC-AGI-2：達(dá)到了前所未有的84.6%，并獲得ARC獎項基金會的驗證；

算法競賽平臺Codeforces：Elo評分達(dá)到了驚人的3455分；

2025 IMO：達(dá)到金牌水平。

除了數(shù)學(xué)和算法競賽，Gemini 3 Deep Think現(xiàn)在在化學(xué)和物理等廣泛的科學(xué)領(lǐng)域也表現(xiàn)優(yōu)異。

在2025年國際物理奧林匹克和化學(xué)奧林匹克的筆試部分，新版Deep Think同樣具備了金牌實力。

它在高級理論物理方面也游刃有余，在CMT-Benchmark測試中取得了50.5%的成績。

另外，Gemini 3 Deep Think在ARC-AGI-1上，直接頂?shù)筋^了。

官方演示中，Gemini 3 Deep Think可以根據(jù)論文，為「時空循環(huán)視頻Transformer」架構(gòu)創(chuàng)建一個的視化方案。

Deep Think殺入科研，十倍加速

除了頂尖的性能表現(xiàn)，Deep Think還突破了智能邊界，能夠解決科學(xué)、研究和工程領(lǐng)域的現(xiàn)代難題。

它不僅能幫助科研人員解讀復(fù)雜數(shù)據(jù)，還能輔助工程師通過代碼對物理系統(tǒng)建模。

在早期測試中，許多科學(xué)家在科研工作流中，顯著提升了研究產(chǎn)出質(zhì)量。

在杜克大學(xué)，Wang Lab用Deep Think優(yōu)化了復(fù)雜晶體生長的制造方法，以用于潛在的半導(dǎo)體材料發(fā)現(xiàn)。

令人意想不到，Deep Think成功設(shè)計出了一種生長大于100 μm薄膜的配方，達(dá)到了以前方法難以實現(xiàn)的精確目標(biāo)。

我不是CAD設(shè)計師，但有了Deep Think，可以直接將草圖變成可3D打印的實物。

它會分析繪圖，對復(fù)雜形狀進(jìn)行建模，并生成3D打印所需的模型文件，讓物理零部件建模加速十倍。

只需發(fā)送一張圖片、一個提示詞，它就能夠深入思考，便可以提供幾個之前從自己未想過的全新設(shè)計方案。

Deep Think將深厚的科學(xué)知識與實用的工程能力相結(jié)合，超越了抽象理論，真正開始推動實際應(yīng)用。

網(wǎng)友驚艷實測，物理模擬太強

在實測中，Gemini 3 Deep Think展現(xiàn)出超強的物理模擬能力。

它可以模擬光線追蹤，在瀏覽器中就可以實現(xiàn)。

并且還可以在單個HTML文件中，構(gòu)建出一個完整的Three.js場景，渲染出博物館中古典油畫難以區(qū)分的全3D室內(nèi)房間。

Simon Willison用Gemini 3 Deep Think畫了一張鵜鶘騎自行車的SVG矢量圖，效果非常驚艷。

他表示，這是自己目前見過最棒的一版了。

既然在處理那條基礎(chǔ)的「生成一張鵜鶘騎自行車的SVG」指令時表現(xiàn)得這么出色，Simon決定加大難度，試個更有挑戰(zhàn)性的版本：

生成一張加州褐鵜鶘騎自行車的SVG圖像。自行車必須要有輻條，車架形狀要準(zhǔn)確。鵜鶘必須具備其標(biāo)志性的大喉囊，且要有清晰的羽毛細(xì)節(jié)。必須能清楚地看出鵜鶘正在蹬車。圖像需要展示加州褐鵜鶘完整的繁殖羽特征。

結(jié)果如下：

這一次，谷歌讓AI真正滲透進(jìn)了科研工作的「最后一公里」：審閱論文、工業(yè)設(shè)計、實驗優(yōu)化，無所不包。

當(dāng)AI能夠揪出連人類審稿人都忽略的邏輯漏洞時，「輔助工具」這四個字顯然已經(jīng)配不上它了。

如今，壓力球拋回給了OpenAI。

面對谷歌這記直擊痛點的「深思」回?fù)簦瑠W特曼的下一張王牌，必須足夠震撼。

參考資料：

https://x.com/GoogleDeepMind/status/2021981512925585703

https://x.com/GoogleDeepMind/status/2021981510400709092

https://x.com/kimmonismus/status/2021983169478533148

更多>同類資訊

聯(lián)想楊元慶：推動AI普及普惠不是讓大家都去用豆包、千問和Kimi

02-13

Android 17開啟上線倒計時：代號“肉桂卷”，計劃6月發(fā)布正式版

02-13

告別“內(nèi)卷式”降價？官方發(fā)文嚴(yán)禁低于成本傾銷，小米承諾合規(guī)經(jīng)營

02-13

國產(chǎn)手機開年承壓：華為小米OV齊跌，蘋果借補貼紅利獨占鰲頭

02-13

聯(lián)想楊元慶談AI泡沫論：整體無泡沫，算力結(jié)構(gòu)將迎來“二八倒置”

02-13

iOS 27四大升級亮點曝光！iPhone 18 Pro系列將率先搭載新系統(tǒng)

02-13

小紅書加強AI內(nèi)容管理：強制標(biāo)識AI生成內(nèi)容，未標(biāo)識將受分發(fā)限制

02-13

索尼WF-1000XM6降噪耳機來襲：多項升級，音質(zhì)通話佩戴體驗全優(yōu)化

02-13

小米汽車交付成績亮眼：自4月3日以來累計交付超60萬臺

02-13

谷歌Gemini 3 Deep Think硬核升級：從抽象推理到科研工程實戰(zhàn)新跨越

02-13

谷歌Gemini 3 Deep Think重大升級數(shù)學(xué)編程出色物理化學(xué)奧賽達(dá)金牌水準(zhǔn)

02-13

字節(jié)跳動自研芯片戰(zhàn)略加速推進(jìn)：團(tuán)隊規(guī)模破千，2026年AI投入或達(dá)1600億

02-13

馬斯克點贊Seedance 2.0引熱議，字節(jié)加速布局視頻生成賽道但坦言尚有不足

生成式視頻模型正在加速進(jìn)入大眾化產(chǎn)品與企業(yè)工具鏈，字節(jié)跳動發(fā)布視頻創(chuàng)作模型Seedance2.0后在海外迅速走紅，馬斯克在X就相關(guān)內(nèi)容并評論“It's happening fast”，進(jìn)一步放大了市場對視頻…

02-13

馬斯克點贊Seedance 2.0引關(guān)注字節(jié)加速布局視頻生成賽道自曝仍需優(yōu)化

生成式視頻模型正在加速進(jìn)入大眾化產(chǎn)品與企業(yè)工具鏈，字節(jié)跳動發(fā)布視頻創(chuàng)作模型Seedance2.0后在海外迅速走紅，馬斯克在X就相關(guān)內(nèi)容并評論“It's happening fast”，進(jìn)一步放大了市場對視頻…

02-13

OpenAI發(fā)布搭載Cerebras芯片的AI模型欲在AI編程助手市場分一杯羹

02-13

點擊查看更多 +

全站最新

A股CPO概念股普跌，長芯博創(chuàng)跌超6%

國家統(tǒng)計局：1月份一二三線城市商品住宅銷售價格環(huán)比降幅總體收窄

港股異動丨金銀價下挫，黃金概念股集體走低，紫金礦業(yè)跌超3%

A股券商股普漲

國家統(tǒng)計局：1月份一二三線城市商品住宅銷售價格同比下降

馬斯克點贊Seedance 2.0引關(guān)注字節(jié)加速布局視頻生成賽道自曝仍需優(yōu)化

熱門內(nèi)容

本欄最新

馬斯克點贊Seedance 2.0引關(guān)注字節(jié)加速布局視頻生成賽道自曝仍需優(yōu)化

小米汽車響應(yīng)《汽車行業(yè)價格行為合規(guī)指南》：優(yōu)化管理，共促產(chǎn)業(yè)高質(zhì)量發(fā)展

字節(jié)跳動Seedance2.0發(fā)布：多模態(tài)生成，真人出鏡需校驗，獲多方贊譽

小米YU7月銷近4萬引關(guān)注，雷軍透露產(chǎn)品策略與市場布局新動向

雷軍親測新一代SU7引關(guān)注自動駕駛升級與品鑒活動共促小米汽車新發(fā)展

職場高效利器大比拼：科大訊飛AI翻譯耳機憑36小時續(xù)航脫穎而出！

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

清華傳奇姚順宇立功！全新Gemini一夜血洗編程