外界還在消化最近一周的 Gemini 3 Deep Think、Opus 和 Sonnet 4.6、GLM-5、Minimax M2.5 等重磅更新時,今天,Google 又毫無預兆地擲除了最新核彈——升級版核心模型 Gemini 3.1 Pro 正式發布,并全面接入旗下消費級與開發者生態。
Gemini 3.1 Pro 的核心敘事非常清晰:專為復雜任務而生,將機器推理能力推向了前所未有的極境。
但需要指出的是:作為一個「.1」更新,Gemini 3.1 Pro 模型在「抽象推理解謎」類型的 ARC-AGI-2 基準測試中,居然拿到了比 3 Pro 高出整整一倍的成績……
——有理由相信,主要原因可能不在于真有多么大的突破,而是測試集很有可能出現在了訓練集里……
其它方面,Gemini 3.1 Pro 在科學知識測試 GPQA Diamond 上拿了 94.3%,智能體類基準 MCP Atlas 和 BrowseComp 分別拿下 69.2% 和 85.9%,高于 Anthropic 和 OpenAI 同級模型。
Google 大佬 Jeff Dean 也轉發了一個使用 Gemini 3.1 Pro 模擬城市規劃、設計全新城市的應用,從零生成可交互的規劃界面 demo。
這體現了 Gemini 3.1 Pro 強大的代碼生成和復雜邏輯處理能力。
Google 官方展示了一個 demo,讓模型直接接入公開遙測數據流,搭出了一個實時追蹤國際空間站軌道的酷炫網頁。
Google AI Pro 與 Ultra 訂閱用戶已經可以使用 3.1 Pro 模型,并且使用限額比此前更高。另外在 Gemini 產品當中,3.1 Pro 模型也加入了音樂生成能力。不過愛范兒測試了幾次音樂生成,一直失敗。
價格方面,API 按分級付費,整體和上代 3 Pro 保持一致,但跟 Anthropic Opus 系列比還是相對便宜的。
開發者可以在 AI Studio、Gemini API、Gemini CLI、智能體開發平臺 Antigravity 上,企業用戶在 Vertex AI 和 Gemini Enterprise 調用 3.1 Pro 模型。
最后,該發的都發了……DeepSeek 啥時候出來再一次殺死游戲呢?











