百度近日正式推出原生全模態大模型文心5.0,標志著我國人工智能領域在多模態技術上取得重大突破。該模型擁有2.4萬億參數規模,通過原生全模態統一建模技術,實現了文本、圖像、音頻、視頻等信息的無縫融合與協同處理。與傳統的"后期融合"方案不同,文心5.0采用統一的自回歸架構,將多源數據在單一模型框架內進行聯合訓練,使不同模態的特征在統一架構下深度融合,從而具備真正的全模態理解與生成能力。
在技術架構方面,文心5.0創新性地采用超大規模混合專家結構,通過超稀疏激活參數設計,將激活參數比例控制在3%以下。這種設計在保持模型強大性能的同時,顯著提升了推理效率。模型還基于大規模工具環境合成長程任務軌跡數據,并運用思維鏈和行動鏈的端到端多輪強化學習訓練方法,大幅增強了智能體和工具調用能力。在權威基準測試中,文心5.0的語言與多模態理解能力已超越Gemini-2.5-Pro、GPT-5-High等國際領先模型,圖像與視頻生成能力達到垂直領域專精模型水平,整體技術指標位居全球前列。
發布會上,百度應用模型研發部負責人賈磊重點介紹了模型的應用落地實踐。他強調:"應用模型的價值不在模型本身,而在于實際場景中的應用效果。"基于文心基礎大模型,百度構建了矩陣模型和專精模型兩大體系。矩陣模型包含文心Lite、視頻大模型和語音大模型,主要面向產品級應用和通用場景;專精模型則針對搜索、電商、數字人等特定領域開發,包括搜索閃電專精模型、電商蒸汽機模型等行業解決方案。賈磊現場演示了三項突破性技術:基于聲音Token的端到端合成大模型可實現高度自然的語音合成;5分鐘直播技術通過少量音色采樣即可生成具備專業帶貨能力的直播語音;實時交互數字人技術采用三態Token聯動架構,使數字人具備低延遲、高表現力的交互能力,百度羅永浩數字人正是基于該技術開發。
為推動大模型在產業界的落地應用,百度千帆平臺推出了專為行業打造的Agent Infra解決方案。該平臺提供文心5.0及150多個場景化SOAT模型服務,集成百度AI搜索等工具鏈,結合數據管理和企業級服務能力,為企業提供全周期、多場景的業務運行環境。據平臺產品負責人張婷介紹,千帆平臺已累計開發超過130萬個智能體應用,以百度AI搜索為代表的工具日均調用量突破千萬次。目前,個人用戶可通過文心APP和官網體驗模型能力,企業與開發者則可通過千帆平臺進行模型調用和開發。
作為國內大模型領域的先行者,百度已形成完整的"芯云模體"技術生態閉環。該生態以自主研發的芯片為底層支撐,智能云作為平臺框架,大模型為核心引擎,支撐各類智能體應用開發。這種全棧自研能力使百度能夠打通從芯片到應用的完整技術鏈條,為行業提供更具競爭力的AI解決方案。隨著文心5.0的正式上線,百度正持續探索AI技術在真實行業場景中的應用路徑,推動人工智能從技術突破向價值創造的轉變。










