谷歌公司近日宣布,對其旗下廣受歡迎的Gemini 3人工智能大模型進行重大升級,重點強化了Deep Think(深度思考)模式在科學、編程、研究與工程領域的應用能力。這一升級被視為人工智能領域的重要突破,有望在全球范圍內引發新一輪技術熱潮。谷歌在官方聲明中透露,新的Deep Think功能已通過Gemini 3系列應用向Google AI Ultra訂閱用戶開放,同時首次通過Gemini API向特定研究人員、工程師和大型企業提供早期訪問權限。
據谷歌介紹,升級后的Deep Think模式具備將草圖轉化為可3D打印實體物品的強大能力。該系統能夠精準分析圖紙,對復雜形狀進行建模,并生成適用于3D打印的制造文件。這一功能不僅簡化了設計流程,還為制造業和原型開發領域帶來了新的可能性。谷歌工程師表示,Deep Think的核心優勢在于其處理邊界模糊、數據不完整和目標函數復雜場景的能力,能夠幫助研究人員和工程師更快地獲得可驗證的結論和可執行的方案。
在性能評估方面,Deep Think在多個權威基準測試中取得了突破性成績。該模型在Humanity’s Last Exam(無工具版本)中達到48.4%的準確率,在ARC-AGI-2測試中取得經ARC Prize基金會驗證的84.6%高分,并在Codeforces競技編程平臺上獲得3455的Elo評級。這些成績表明,Deep Think在學術推理、抽象歸納和工程算法實現等方面實現了全面提升。更引人注目的是,該模型在2025年國際物理和化學奧林匹克競賽的筆試部分達到了金牌水平,并在凝聚態理論基準測試CMT-Benchmark中取得50.5%的成績,顯示出其跨學科科研問題的處理能力。
谷歌強調,Deep Think的升級不僅體現在性能提升上,更在于其應用場景的拓展。該模型現已能夠處理物理直覺、化學結構推斷、數學形式化表達和代碼化求解等復雜任務,形成了完整的科研問題解決組合。這種能力使Deep Think從單純的答題工具轉變為能夠參與真實科研和工程流程的專業推理引擎。谷歌DeepMind團隊同時披露,基于Deep Think的研究型代理(如內部代號Aletheia)已具備通過自然語言驗證器捕捉邏輯漏洞、觸發重寫或推倒重來的能力,這標志著人工智能向實際科研工作邁出了重要一步。
從技術實現角度看,Deep Think的核心突破在于其結構化推理過程和可擴展的推理算力。該系統通過迭代式推理在多個假設空間并行探索,并在“生成-驗證-修正”的閉環中不斷優化結果。這種機制使Deep Think能夠處理傳統AI模型難以應對的復雜問題。谷歌表示,此次升級不僅面向個人用戶,更注重企業級應用。通過Gemini API,Deep Think可以輕松嵌入企業研發鏈條,支持數據分析、仿真建模、代碼驅動物理系統建模和自動化實驗設計等關鍵環節。結合其“草圖到3D打印”等直觀演示功能,Deep Think具備了引發技術傳播和商業應用的雙重潛力。
在競爭格局方面,谷歌的這一升級使其在與OpenAI的ChatGPT和Anthropic的Claude等產品的競爭中占據有利地位。Deep Think的專用推理模式定位和明確的應用場景,使其更容易吸引開發者和機構的關注。谷歌透露,此次升級是與Vertex AI早期計劃聯動推出的,旨在為企業用戶提供更完整的人工智能解決方案。隨著Deep Think功能的逐步開放,預計將在科研機構、制造業和工程領域引發新一輪的人工智能應用浪潮。










