當OpenAI和Anthropic的“握手風波”還在科技圈引發討論時,谷歌已悄然完成了一次模型迭代——從Gemini 3.0升級至Gemini 3.1 Pro Preview。盡管版本號僅增加0.1,但這一“小步”卻帶來顯著突破。谷歌CEO皮查伊直言,新模型在處理“超級復雜任務”方面展現出強大能力,包括將抽象概念可視化、整合多源數據以及將創意轉化為可交互系統。
此次升級并非孤立事件。一周前,谷歌剛推出專為科學、工程領域設計的“專用推理模式”Gemini 3 Deep Think,而3.1 Pro Preview直接繼承了其核心技術。這種“技術下放”策略,讓原本面向專業場景的推理能力得以覆蓋更廣泛的用戶群體。例如,在SVG動畫生成任務中,新模型不僅能根據提示詞創建動畫,還能自動優化細節:當要求生成“變色龍眼睛跟隨鼠標移動”時,3.1 Pro版本不僅修正了前代模型中“一側出現兩只眼睛”的錯誤,還為動畫添加了深綠色叢林背景和黃色斑紋,使效果更接近專業設計。
更復雜的工程級系統構建能力,成為新模型的另一大亮點。在谷歌展示的案例中,用戶僅需輸入自然語言指令,3.1 Pro Preview就能自動生成一個集成3D渲染、實時天文計算和物理光效的交互系統——一個可追蹤國際空間站軌道的高保真模擬器。這種能力已超越簡單頁面開發,進入工程原型設計領域。類似的技術突破還體現在3D椋鳥群舞模擬中,模型不僅生成視覺代碼,還通過手部追蹤技術讓用戶操控鳥群,并配合生成式配樂,創造出沉浸式體驗。
文學與代碼的跨界融合,則展示了模型的抽象推理實力。當被要求為《呼嘯山莊》設計個人作品集網站時,3.1 Pro Preview沒有簡單復述小說內容,而是基于文本氛圍與情緒推理,設計出簡潔現代的界面,精準捕捉主人公的精神內核。這種能力在ARC-AGI-2基準測試中得到驗證:新模型推理性能較前代提升超一倍,驗證得分達77.1%。在科學知識測試GPQA Diamond中,其得分高達94.3%,超越Anthropic的Sonnet 4.6和OpenAI的GPT-5.2等競品。
性能躍升的同時,谷歌維持了原有定價策略:輸入/輸出每百萬token分別收費2美元和4美元(小于200k tokens時),上下文緩存費用為每百萬token 0.20至0.40美元。這種“加量不加價”的策略,使其在前沿模型中具備成本優勢——運行完整Artificial Analysis Intelligence Index的成本不到Opus 4.6(max)的一半。第三方評測機構指出,3.1 Pro Preview在10項核心能力評測中領先6項,尤其在推理、代碼生成和降低幻覺方面進步顯著。
開發者社區已迅速響應這一升級。有人用新模型創建了可交互的3D汽車懸架系統模擬器,集成真實幾何結構與物理邏輯;有人制作了“捉鬼獵人探索鬧鬼房屋”的循環動畫,效果逼真到引發驚嘆。目前,3.1 Pro Preview已通過AI Studio、Gemini API等平臺向開發者開放,企業用戶可在Vertex AI中使用,普通用戶則能通過Gemini應用和NotebookLM(需Pro/Ultra訂閱)體驗。這場由0.1版本號引發的技術震蕩,正迫使整個行業重新思考:在AI競爭進入深水區后,如何平衡性能突破與成本控制,或許將成為決定勝負的關鍵。












