AIPress.com.cn報道
1月14日消息,谷歌宣布推出升級版醫療多模態AI模型MedGemma 1.5,以及全新的醫療語音識別模型MedASR,為開發者提供開放、可擴展的AI工具,用于醫療影像解讀、電子病歷處理和語音病歷轉寫。
MedGemma 1.5在原有MedGemma 1的基礎上,提升了文本、醫療記錄和二維影像分析能力,并新增對高維醫療影像的支持,包括CT、MRI和全片病理圖像。MedGemma 1.5優化了胸部X光系列圖像分析、解剖結構定位和醫療實驗室報告數據提取等功能,在內部基準測試中表現出明顯性能提升。
配套發布的MedASR模型則專為醫療語音轉文本場景設計,可將醫療口述內容準確轉換為文字,同時可與MedGemma 1.5結合,用于高級醫療推理和應用開發。與通用ASR模型相比,MedASR在胸部X光病歷轉寫任務中的錯誤率降低約58%,在多專業語音轉寫任務中的錯誤率降低約82%。
MedGemma 1.5及MedASR均以開放方式提供給研究和商業用途,開發者可通過Hugging Face或谷歌云Vertex AI進行下載、訓練及應用開發。谷歌還啟動了MedGemma Impact Challenge黑客馬拉松,提供10萬美元獎金,鼓勵開發者探索醫療AI創新應用。
谷歌提示用戶,這些模型可作為開發者構建醫療AI應用的起點,但需要經過適當驗證、調整或開發者自定義修改后方可用于實際醫療場景。模型輸出不應直接用于臨床診斷或病患管理。











