近日,公司正式發布新一代開源醫療大模型 MedGemma 1.5,并在同期推出專為臨床場景設計的開源語音識別模型 MedASR,進一步完善其在醫療垂直領域的技術棧。
作為Gemma系列的醫療專用版本,MedGemma 1.5 在前代基礎上顯著增強了對醫學影像的理解與分析能力。該模型不僅能處理文本病歷、檢驗報告和醫學文獻,還可結合X光、CT等常見影像模態的描述性數據,輔助進行初步篩查與診斷推理。這一升級使MedGemma從純文本問答工具,邁向多模態臨床決策支持系統,更貼近真實醫療工作流。
與此同時,MedASR 的推出直擊醫生文書負擔痛點。該模型專為醫療語音場景優化,能高精度識別醫患對話、查房記錄、手術口述等專業內容,并自動轉寫為結構化文本,大幅提升電子病歷錄入效率。谷歌強調,兩個模型均基于去標識化的臨床數據訓練,嚴格遵循隱私保護規范,并以開源形式發布,供全球研究者與開發者免費使用。
此次雙模型發布,標志著谷歌在醫療AI領域從“封閉服務”向“開放賦能”戰略的深化。繼Gemini醫療助手通過HIPAA合規認證后,開源模型的推出將進一步降低醫療機構、初創公司及學術團隊的創新門檻,推動AI在基層醫療、遠程診療和科研分析等場景的普惠應用。
在AI醫療從“可用”走向“好用”的關鍵階段,谷歌正以開源+合規+多模態的組合拳,構建一個兼具安全性、實用性與可擴展性的醫療AI生態底座。






