谷歌近日宣布推出全新圖像生成模型Nano Banana 2,在分辨率、生成一致性及多語言支持等方面實現顯著突破。該模型基于Gemini 3.1 Flash Image架構升級,圖像輸出分辨率從2K提升至4K,同時優化了文本渲染精度與畫面元素融合能力。據技術文檔披露,新版本通過改進算法架構,成功解決了前代模型存在的中文字符亂碼、語義邏輯混亂及畫面偽影等核心問題。
在功能整合方面,Nano Banana 2創新性地融合了Gemini Flash的極速響應特性與Nano Banana Pro的語義理解能力。用戶可在單次工作流中保持最多5個角色形象的高度一致性,同時支持單張畫面內嵌入14種不同元素。特別值得關注的是,該模型引入實時網絡搜索功能,可動態調用最新信息輔助圖像生成,并實現跨語言文本的精準渲染與翻譯。
實際應用測試顯示,中文場景下的字符識別準確率較前代提升超過80%,復雜語義結構的圖像生成錯誤率下降65%。某科技媒體進行的對比實驗表明,在涉及多人物互動的場景中,新模型的角色一致性指標達到92.7%,較前代提升23個百分點。
在部署范圍上,谷歌計劃將該模型同步上線至Gemini應用、Google搜索(AI模式與Lens)、AI Studio開發平臺等12個核心產品矩陣。服務區域將擴展至141個新增市場,支持阿拉伯語、印地語等8種新語言環境。值得注意的是,Gemini應用將默認啟用Nano Banana 2作為圖像生成引擎,專業版用戶仍可通過菜單切換回前代Pro版本。
技術團隊透露,新模型采用分層渲染架構,通過分離語義解析與視覺生成模塊,在保持生成速度的同時提升復雜場景的處理能力。谷歌云部門同步宣布,Vertex AI平臺將開放模型微調接口,允許企業客戶基于自有數據訓練定制化圖像生成模型。











