谷歌近日宣布,正式推出新一代圖像生成模型——Nano Banana 2。該模型以Gemini 3.1 Flash Image為基礎架構,在響應速度、語義理解及提示詞解析能力上實現顯著突破,能夠更精準地捕捉用戶需求并生成高質量圖像。
針對前代模型存在的技術短板,Nano Banana 2進行了針對性優化。通過改進算法架構,新模型徹底解決了中文字符亂碼、語義邏輯混亂以及畫面偽影等常見問題,同時大幅提升生成內容的連貫性。在復雜場景處理方面,該模型支持在單張畫面中融合多達14個獨立元素,并能在跨圖生成時保持最多5個角色形象的一致性,為創意工作者提供更靈活的創作空間。
性能參數方面,Nano Banana 2將圖像輸出分辨率從2K提升至4K級別,能夠處理更精細的視覺細節。據技術文檔顯示,新模型在多模態理解能力上取得進展,可同時解析文字描述與參考圖像中的關鍵特征,生成符合邏輯的復合型畫面。這一改進使得模型在廣告設計、數字內容創作等領域的應用潛力大幅增強。
谷歌已制定詳細的部署計劃,Nano Banana 2將分階段接入旗下多款產品。首批更新覆蓋Gemini智能助手、Google AI Studio開發平臺及Google Flow創意工具,隨后逐步擴展至搜索引擎、付費API服務及Google Ads廣告系統。此次升級標志著谷歌在生成式AI領域的技術迭代進入新階段,相關服務預計在未來兩周內完成全球范圍推送。














