就在科技圈還在熱議近期一系列AI模型重大更新時,谷歌再次拋出重磅消息:升級版核心模型Gemini 3.1 Pro正式登場,并全面融入其消費級產(chǎn)品與開發(fā)者生態(tài)體系。這款新模型被定位為"復雜任務處理專家",官方宣稱其機器推理能力達到全新高度。
在基準測試中,Gemini 3.1 Pro展現(xiàn)出驚人表現(xiàn)。盡管作為".1"版本迭代,該模型在ARC-AGI-2抽象推理測試中的得分竟達到前代3 Pro的兩倍。不過有專家指出,這種異常提升可能源于測試數(shù)據(jù)與訓練數(shù)據(jù)存在重疊。在其他專項測試中,該模型在科學知識評估GPQA Diamond取得94.3%的準確率,智能體能力測試MCP Atlas和BrowseComp分別獲得69.2%和85.9%的得分,均領先于Anthropic和OpenAI的同級別模型。
谷歌首席科學家Jeff Dean展示的案例凸顯了新模型的實用價值。在一個城市規(guī)劃演示中,Gemini 3.1 Pro從零開始生成了可交互的3D城市模型,完整呈現(xiàn)道路網(wǎng)絡、建筑布局和公共設施規(guī)劃。另一個公開演示中,該模型直接接入實時遙測數(shù)據(jù)流,構建出能夠追蹤國際空間站軌道的動態(tài)網(wǎng)頁,展示了強大的數(shù)據(jù)處理與可視化能力。
在功能擴展方面,Gemini 3.1 Pro首次引入音樂生成模塊,但實際測試中該功能表現(xiàn)尚不穩(wěn)定。服務層級上,AI Pro與Ultra訂閱用戶已可體驗新模型,且使用配額較前代有所提升。企業(yè)用戶可通過Vertex AI和Gemini Enterprise平臺調用,開發(fā)者則能在AI Studio、Gemini API等工具鏈中使用。
定價策略保持延續(xù)性,API調用費用與3 Pro持平,較Anthropic的Opus系列仍具價格優(yōu)勢。值得注意的是,谷歌此次同步更新了智能體開發(fā)平臺Antigravity和命令行工具Gemini CLI,為專業(yè)開發(fā)者提供更完整的工具鏈支持。隨著頭部企業(yè)相繼完成模型迭代,業(yè)界目光開始轉向尚未發(fā)布新品的DeepSeek,期待其能帶來新的技術突破。









