岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

清華傳奇姚順宇立功!全新Gemini一夜血洗編程

   時間:2026-02-13 11:29:16 來源:新智元編輯:快訊 IP:北京 發(fā)表評論無障礙通道
 

新智元報道

編輯:桃子 好困

剛剛,谷歌Gemini 3 Deep Think原地進(jìn)化!在Codeforces比賽中拿下全球第七,擊敗了人類選手。短短三個月,全方位刷爆SOTA。

猝不及防,谷歌DeepMind深夜又放大招了!

今天,Gemini 3 Deep Think重磅升級,幾乎刷爆全領(lǐng)域的SOTA,標(biāo)志著AI推理能力進(jìn)入了全新維度。

離職Anthropic入職谷歌的華人學(xué)者姚順宇參與了Gemini 3 Deep Think

這一次,在科學(xué)研究和硬核工程領(lǐng)域,Deep Think堪稱一個「最強大腦」。

它可以將草圖渲染成一個高保真、實用的3D筆記本電腦支架圖,并直接將其打印出來。

谷歌VP曬出這個副項目,最終的成品是這樣子的。

新版Deep Think的實力究竟有多恐怖?

在編程界,它刷出了3455 Elo的驚人分?jǐn)?shù),達(dá)到世界冠軍級的水準(zhǔn),沖入了Codeforces比賽人類TOP 10!

也就是說,全球只有7人擊敗了Gemini 3 Deep Think,一年前,最強o3也僅拿下2727 Elo。

在人類最后考試(HLE)上,Gemini 3 Deep Think刷新SOTA,拿下了48.4%的成績。

甚至,它在一夜之間讓最難的ARC-AGI-2基準(zhǔn)直接飽和,以84.6%新SOTA一騎絕塵。

左右滑動查看

與Gemini 3 Pro相比,Deep Think實現(xiàn)了全方位反超,并將Claude Opus 4.6、GTP-5.2直接踩在了腳下。

更令人震撼的是,Gemini 3 Deep Think的實戰(zhàn)表現(xiàn)。

羅格斯大學(xué)數(shù)學(xué)家Lisa Carbone在研究時,讓它審查一篇高深的物理數(shù)學(xué)論文。

結(jié)果,Deep Think竟發(fā)現(xiàn)了一個連人類同行評審,都遺漏的細(xì)微邏輯漏洞。

Gemini 3 Deep Think這波史詩級進(jìn)化,又讓某些人睡不著了。

目前,Google AI Ultra訂閱用戶即可在Gemini中體驗新版Deep Think。同時,首次通過API向部分研究人員、工程師和企業(yè)開放。

實力刷爆SOTA,奧賽金牌大滿貫

去年,Deep Think專門版成功解決了推理領(lǐng)域最艱巨的任務(wù),在數(shù)學(xué)和編程世界錦標(biāo)賽中奪下金牌。

就在昨天,谷歌DeeoMind還做了一個預(yù)熱。

背靠初代Deep Think的「AI數(shù)學(xué)家」Aletheia可以獨立撰寫論文,證明了「Erd?s猜想」中多個難題。

不僅如此,Deep Think直接推翻了十年猜想,一舉攻克18大研究瓶頸。

而現(xiàn)在,迭代后的Deep Think已在多項高難度的基準(zhǔn)測試中刷新SOTA:

人類最后的考試(HLE):設(shè)定了新標(biāo)桿,在不使用工具的情況下準(zhǔn)確率達(dá)48.4%;

ARC-AGI-2:達(dá)到了前所未有的84.6%,并獲得ARC獎項基金會的驗證;

算法競賽平臺Codeforces:Elo評分達(dá)到了驚人的3455分;

2025 IMO:達(dá)到金牌水平。

除了數(shù)學(xué)和算法競賽,Gemini 3 Deep Think現(xiàn)在在化學(xué)和物理等廣泛的科學(xué)領(lǐng)域也表現(xiàn)優(yōu)異。

在2025年國際物理奧林匹克和化學(xué)奧林匹克的筆試部分,新版Deep Think同樣具備了金牌實力。

它在高級理論物理方面也游刃有余,在CMT-Benchmark測試中取得了50.5%的成績。

另外,Gemini 3 Deep Think在ARC-AGI-1上,直接頂?shù)筋^了。

官方演示中,Gemini 3 Deep Think可以根據(jù)論文,為「時空循環(huán)視頻Transformer」架構(gòu)創(chuàng)建一個的視化方案。

Deep Think殺入科研,十倍加速

除了頂尖的性能表現(xiàn),Deep Think還突破了智能邊界,能夠解決科學(xué)、研究和工程領(lǐng)域的現(xiàn)代難題。

它不僅能幫助科研人員解讀復(fù)雜數(shù)據(jù),還能輔助工程師通過代碼對物理系統(tǒng)建模。

在早期測試中,許多科學(xué)家在科研工作流中,顯著提升了研究產(chǎn)出質(zhì)量。

在杜克大學(xué),Wang Lab用Deep Think優(yōu)化了復(fù)雜晶體生長的制造方法,以用于潛在的半導(dǎo)體材料發(fā)現(xiàn)。

令人意想不到,Deep Think成功設(shè)計出了一種生長大于100 μm薄膜的配方,達(dá)到了以前方法難以實現(xiàn)的精確目標(biāo)。

我不是CAD設(shè)計師,但有了Deep Think,可以直接將草圖變成可3D打印的實物。

它會分析繪圖,對復(fù)雜形狀進(jìn)行建模,并生成3D打印所需的模型文件,讓物理零部件建模加速十倍。

只需發(fā)送一張圖片、一個提示詞,它就能夠深入思考,便可以提供幾個之前從自己未想過的全新設(shè)計方案。

Deep Think將深厚的科學(xué)知識與實用的工程能力相結(jié)合,超越了抽象理論,真正開始推動實際應(yīng)用。

網(wǎng)友驚艷實測,物理模擬太強

在實測中,Gemini 3 Deep Think展現(xiàn)出超強的物理模擬能力。

它可以模擬光線追蹤,在瀏覽器中就可以實現(xiàn)。

并且還可以在單個HTML文件中,構(gòu)建出一個完整的Three.js場景,渲染出博物館中古典油畫難以區(qū)分的全3D室內(nèi)房間。

Simon Willison用Gemini 3 Deep Think畫了一張鵜鶘騎自行車的SVG矢量圖,效果非常驚艷。

他表示,這是自己目前見過最棒的一版了。

既然在處理那條基礎(chǔ)的「生成一張鵜鶘騎自行車的SVG」指令時表現(xiàn)得這么出色,Simon決定加大難度,試個更有挑戰(zhàn)性的版本:

生成一張加州褐鵜鶘騎自行車的SVG圖像。自行車必須要有輻條,車架形狀要準(zhǔn)確。鵜鶘必須具備其標(biāo)志性的大喉囊,且要有清晰的羽毛細(xì)節(jié)。必須能清楚地看出鵜鶘正在蹬車。圖像需要展示加州褐鵜鶘完整的繁殖羽特征。

結(jié)果如下:

這一次,谷歌讓AI真正滲透進(jìn)了科研工作的「最后一公里」:審閱論文、工業(yè)設(shè)計、實驗優(yōu)化,無所不包。

當(dāng)AI能夠揪出連人類審稿人都忽略的邏輯漏洞時,「輔助工具」這四個字顯然已經(jīng)配不上它了。

如今,壓力球拋回給了OpenAI。

面對谷歌這記直擊痛點的「深思」回?fù)簦瑠W特曼的下一張王牌,必須足夠震撼。

參考資料:

https://x.com/GoogleDeepMind/status/2021981512925585703

https://x.com/GoogleDeepMind/status/2021981510400709092

https://x.com/kimmonismus/status/2021983169478533148

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 国产精品久久久久一区二区三区 | 亚洲激情黄色 | 国产日韩片 | 在线看片网站 | 日韩久久一区二区三区 | 久久97视频 | 久久精品成人 | 日本男人的天堂 | 四虎影院www.| 午夜在线免费观看视频 | 蜜桃传媒一区二区亚洲 | 国产4区 | 日本韩国一区二区三区 | 成人日韩欧美 | 久久免费视频观看 | 日韩国产激情 | 亚洲国产视频网站 | 免费在线黄色网 | 98久久| 日韩av综合| 日本a级大片 | 午夜精品国产精品大乳美女 | 超碰免费在线 | 久久久www | 51成人做爰www免费看网站 | 黄网站在线观看 | av网站免费在线 | 伊人久久影视 | 亚洲天堂欧美 | 韩国三级av | 日韩一级二级三级 | 国产精品天天狠天天看 | 婷婷六月丁| 狠狠干夜夜干 | 天堂综合| 青青国产在线视频 | 久久久精品视频在线 | 波多野结衣黄色 | 国产精品情侣呻吟对白视频 | 中国妇女裸体交性大片 | 香蕉国产精品 |