谷歌今日正式推出Gemma 4系列開放權重AI模型,為開發者提供四種針對不同場景優化的本地化解決方案。這一更新不僅在性能上實現顯著突破,更通過許可證調整回應了開發者社區長期以來的訴求,標志著谷歌在開放模型領域邁出重要一步。
性能升級是Gemma 4的核心亮點。基于與Gemini 3相同的底層架構,新模型在推理能力、數學計算和指令響應方面均有提升。260億參數的專家混合模型通過動態激活38億參數子集,在保持精度的同時將處理速度提升至同類模型前列;310億參數的稠密模型則通過優化參數質量,在生成質量上實現突破。針對移動設備優化的20億(E2B)和40億(E4B)參數模型,通過內存管理技術將延遲降低至接近零水平,同時保持低功耗特性。
硬件適配性方面,谷歌為不同需求提供靈活選擇。高端版本可完整運行在配備80GB顯存的英偉達H100 GPU上,量化后版本則能適配消費級顯卡。移動端模型通過與高通、聯發科合作優化,已實現在Pixel手機、樹莓派等設備上的原生部署。測試數據顯示,E2B/E4B模型在語音識別、OCR等任務中的內存占用較前代降低30%,電池消耗減少25%。
許可證改革成為本次更新的關鍵轉折。此前采用的定制化協議因條款嚴苛飽受爭議,新版本全面轉向Apache 2.0開源協議。這一改變消除了數據歸屬、模型衍生等限制,開發者可自由將模型用于商業項目,且無需擔心谷歌單方面修改使用條款。法律專家指出,此舉將顯著降低企業采用風險,可能吸引更多傳統行業開發者加入生態。
功能擴展方面,Gemma 4新增對結構化數據輸出的原生支持,可直接生成JSON格式響應,并內置函數調用能力。代碼生成模塊經過專項優化,在離線環境下可達到云端模型90%的代碼質量水平。視覺處理能力提升使圖表解析、手寫識別等任務準確率提高15%,上下文窗口擴展至128K-256K Token,雖不及云端模型的百萬級容量,但已滿足多數本地應用需求。
移動端戰略通過Gemini Nano 4的升級路徑得以明確。谷歌確認下一代手機AI模型將基于Gemma 4的E2B/E4B架構開發,現有Pixel設備上的Nano 3模型已展示出詐騙電話攔截、通話摘要生成等實用功能。開發者預覽版現已開放智能體工作流原型設計,相關項目將與Nano 4正式版保持兼容。
模型權重已通過Hugging Face、Kaggle等平臺開放下載,支持完整本地部署。對于有云端需求的用戶,谷歌云提供按需計費服務。行業分析師認為,Gemma 4通過性能與靈活性的平衡,可能在醫療、金融等數據敏感領域引發采用熱潮,其開源策略或將重塑AI模型市場競爭格局。







