在上海舉辦的百度文心Moment大會上,文心大模型5.0正式版正式亮相。這一版本擁有高達2.4萬億的參數規模,采用原生全模態統一建模技術,能夠同時處理文本、圖像、音頻和視頻等多種類型的信息輸入與輸出,展現出強大的全模態理解與生成能力。
在權威基準的綜合評測中,文心5.0正式版表現卓越。其語言與多模態理解能力穩居國際領先行列,圖像與視頻生成能力則與垂直領域的專業模型不相上下,整體技術處于全球前沿水平。這一成績的取得,得益于其獨特的技術路線和創新架構。
與業界普遍采用的“后期融合”多模態方案不同,文心5.0采用了統一的自回歸架構進行原生全模態建模。它將文本、圖像、視頻、音頻等多源數據在同一模型框架內進行聯合訓練,使多模態特征在統一架構下深度融合并協同優化,從而實現了原生的全模態統一理解與生成。這種技術路線不僅提升了模型的性能,還為多模態人工智能的發展開辟了新的路徑。
文心5.0還引入了超大規模混合專家結構,具備超稀疏激活參數特性。其激活參數比低于3%,在保持模型強大能力的同時,顯著提高了推理效率。這一創新設計使得文心5.0在處理復雜任務時更加高效,為用戶提供了更流暢的體驗。
得益于原生全模態建模技術,文心5.0在多模理解、代碼生成和創意寫作等領域實現了顯著突破。無論是理解復雜的圖像和視頻內容,還是生成高質量的代碼和創意文本,文心5.0都展現出了卓越的能力。這些突破不僅提升了模型的應用價值,也為相關領域的發展注入了新的活力。
目前,用戶可以通過文心APP和文心一言官網體驗文心5.0的強大功能,企業與開發者則可通過百度千帆平臺進行調用,滿足多樣化的業務需求。











