谷歌最新發布的Gemini 3 Deep Think模型正在重塑人工智能的能力邊界。這款專為復雜推理任務設計的升級版模型,在數學、編程及多學科領域展現出超越人類頂尖水平的實力,標志著AI技術進入全新發展階段。
在數學競賽領域,該模型以48.4%的準確率刷新"人類終極考試"基準測試紀錄,且未借助任何外部工具。更令人矚目的是,其在2025年國際數學奧林匹克模擬賽中達到金牌標準,并在凝聚態物理基準測試(CMT-Benchmark)中取得50.5%的成績。編程能力方面,模型在Codeforces平臺獲得3455分,排名全球第八,較前代OpenAI模型提升近千分,成本卻降低數百倍。
工程應用場景同樣見證突破性進展。杜克大學團隊利用該模型優化半導體材料制備工藝,成功設計出可生長100微米以上厚度薄膜的制造方案,突破傳統方法精度極限。羅格斯大學物理學家Lisa Carbone則借助模型完成高能物理論文審核,發現人工評審遺漏的邏輯漏洞,驗證了AI在專業學術領域的實用價值。
技術實現層面,模型通過深度融合科學理論與工程實踐,將抽象概念轉化為可操作方案。其最新功能支持將二維草圖直接轉換為3D打印文件,自動完成復雜幾何建模與結構優化。這種跨領域能力源于谷歌與科研機構的深度合作,清華物理系姚順宇等學者參與開發,確保模型在科學問題處理上的嚴謹性。
商業落地方面,Deep Think已通過Gemini應用向Ultra訂閱用戶開放,同時通過API向特定企業及研究機構提供服務。在ARC-AGI系列測試中,模型分別取得96.0%(ARC-AGI-1)和84.6%(ARC-AGI-2)的成績,每任務成本控制在7.17至13.62美元區間,較前代模型降低兩個數量級。這種效率躍升正在推動AI從輔助工具向獨立科研伙伴轉型。










