在醫療人工智能領域,百川智能再次取得突破性進展。其最新發布的Baichuan-M3 Plus大模型,在嚴肅醫療場景的問答準確性和可靠性方面,刷新了此前由M3模型保持的世界紀錄。通過獨創的六源循證技術與M3基座深度融合,M3 Plus將醫學內容生成的幻覺率降至2.6%,這一數據不僅低于行業標桿Open Evidence,更成為全球最低水平。
該模型的核心創新在于"證據錨定"技術。不同于傳統文獻引用方式,這項技術要求模型生成的每句醫學結論都必須精準對應原始論文或臨床指南中的具體段落。為實現這一目標,研發團隊構建了獨立的訓練體系,引入Citation Reward Model機制,對錯誤引用進行懲罰性訓練。最終實現結論與證據匹配準確率超過95%,使AI生成的醫學判斷具備可核驗、可追責、可教學的特性。
在性能優化方面,M3 Plus通過MoE架構重構、模型量化壓縮和Gated Eagle-3投機解碼等工程突破,在保持模型能力的前提下,將API調用成本較前代降低70%。這一改進為醫療場景的規模化應用掃清了關鍵障礙,目前開發者可申請限時15天的免費體驗。
此前發布的M3基礎模型已在Healthbench等權威評測中超越GPT-5.2,特別是在低幻覺領域以3.5%的指標領先全球。此次升級版M3 Plus將事實性幻覺率進一步壓縮至2.6%,較GPT-5.2下降超30%,形成對Open Evidence等國際領先模型的全面超越。這項突破標志著中國在醫療AI領域的技術積累,正從跟隨創新轉向引領發展。
根據技術白皮書披露,M3 Plus的訓練過程涉及超過2000萬篇醫學文獻的深度解析,構建了包含1.2億個證據節點的知識圖譜。其獨特的循證增強機制,使模型在腫瘤診療、罕見病診斷等復雜場景的表現顯著優于通用大模型,為AI醫療的落地應用提供了新的技術范式。











