馬年春節前夕,國內AI領域迎來新一輪激烈競爭,多家平臺企業紛紛推出大模型新版本,展開“百模大戰”。據不完全統計,自今年1月起,文心大模型5.0、千問Qwen3-Max-Thinking、星火X2、智譜GLM-5、Kimi K2.5、MiniMax M2.5、Deepseek V3.2(版本更新)、Seedance 2.0、可靈3.0等新版本大模型相繼問世。豆包大模型2.0、千問Qwen3.5等也計劃在春節期間發布,進一步加劇市場競爭。
在這場競爭中,科大訊飛的星火X2顯得尤為獨特。與其他平臺側重消費級應用和C端用戶不同,星火X2更聚焦于行業應用和B端市場。在國產大模型紛紛轉向消費端的背景下,科大訊飛的這一選擇顯得尤為難得。
國產算力的發展為星火大模型提供了堅實基礎。科大訊飛董事長劉慶峰曾表示:“中國AI開發者只要用星火,出海再也不用擔心卡脖子。”這是因為星火大模型是目前中國主流大模型中唯一基于全國產算力(華為昇騰)訓練的通用大模型。近年來,華為昇騰等國產算力平臺的持續進步,使星火大模型每幾個月就能實現技術突破,從依賴外部算力轉向自主可控,在算力、算法、模型框架、應用落地和生態系統等多個領域實現完全自主。
星火X2的推出標志著科大訊飛開始對標國際頂尖模型。該模型采用293B MoE稀疏架構,結合權重量化、低精度KVCache、VTP(Virtual Tensor Parallel)、分層通信等工程化創新,實現國產大EP并行部署。通過量化,單臺昇騰服務器即可運行,推理性能較X1.5提升50%。這一提升得益于四大技術領域的升級:訓推采樣校準強化學習算法、遞歸式高難數據合成方法、多階段RL高吞吐采樣方法和服務高性能部署優化算法。
科大訊飛表示,星火X2的通用能力已全面升級,整體水平可對標國際頂尖模型,尤其在數學、推理、語言理解和智能體等方面表現優異。其130多種語言綜合能力進一步提升,在拉美、東盟等地區重點語種效果保持領先。例如,在2025年11月哈佛-麻省理工數學錦標賽(HMMT)中,一道英文題目難倒國內主流模型,但星火X2不僅給出正確答案,還提供詳細解題過程。即使是西班牙語數學題,星火X2也能解答。
在通用大模型核心能力對比中,星火X2在語言理解、邏輯推理、數學、翻譯和多語言等方面領先于DeepSeek V3.2和Qwen3-Max。在外部公開高難任務測試中,星火X2在數學(AIME 2025、HMMT Feb 2025)、綜合答題(MMLU Pro)、推理(ARC-AGI-1)和智能體(Tau2-bench)等方向也表現突出。
針對垂直行業,科大訊飛推行“1+N”大模型組合,即1個通用底座大模型加N個定制開發大模型,以更專業、高效地服務不同行業。例如,在醫療領域,基于星火X2的醫療大模型在智能健康分析、報告解讀、運動飲食建議、輔助診療和智能用藥審核等任務上表現超越DeepSeek V3.2、GPT-5.2和Qwen3-Max。訊飛醫療還在建設醫療高質量數據資源平臺,以加速AI+醫療服務的落地。
在教育領域,星火教育大模型在“步驟級批改”和“錯因定位”等技術上擴大領先優勢,并首發“錯因貫穿”的個性化學習能力。作為企業級智能體平臺,星辰Agent平臺的智能體數量已超過130萬,整合了語音交互、語音識別和圖像理解等百余種開放平臺能力,支持快速構建復雜AI智能體。例如,面向企業采購場景的“招采智能體”效率提升超3倍,專用智能體開發時間從幾天壓縮至分鐘級。
隨著星火X2的推出,科大訊飛的硬件AI能力也顯著增強。公司一直推行軟硬件協同發展戰略,旗下汽車智能座艙、翻譯機、辦公本等設備的AI技術應用全面鋪開。例如,汽車智能座艙的新模型在對話判斷、模糊意圖理解和高情商回復等方面顯著提升交互體驗,模糊意圖交互效果從“完全不可用”提升至“基本好用”水平。
在AI學習機上,星火大模型在1對1精準學、答疑輔導和互動課等領域效果持續提升。依托X2教育大模型的精準批改和個性化學習能力,訊飛AI學習機的診斷精準率、規劃合理率和輔學啟發性效果進一步提升,帶來更好的人機交互體驗。
當前,國內AI產業正進入新一輪競爭階段,各平臺開始形成不同的賽道和特色標簽。例如,DeepSeek V3.2繼續推進長上下文與復雜任務能力,智譜GLM-5強調Agent與編程能力,MiniMax M2.5延續多模態與應用導向路線。而科大訊飛則憑借全國產算力訓練的通用大模型、垂直行業應用和軟硬件協同戰略,走出一條獨特的發展道路。










