國家數據局局長劉烈宏在中國發展高層論壇2026年年會上宣布,我國人工智能領域核心計量單位"Token"的官方中文譯名為"詞元"。這一術語不僅承載著智能時代的價值基準功能,更成為連接技術突破與商業落地的關鍵紐帶,為量化評估人工智能應用價值提供了標準化尺度。
作為人工智能系統的信息處理基石,詞元扮演著數字世界的"原子"角色。無論是用戶輸入的自然語言指令,還是系統生成的復雜代碼,都需要經過詞元化拆解才能被模型識別運算。數據顯示,我國日均詞元調用量已從2024年初的1000億次激增至2025年3月的140萬億次,三個月內實現40%的跨越式增長,較年初水平更是實現千倍躍升。
這種指數級增長直接反映在商業價值創造上。某頭部模型企業自2025年1月底以來,僅用20天就達成全年營收目標,印證了以詞元計費為核心的新型商業模式正在重塑產業生態。劉烈宏特別指出,詞元出口業務的蓬勃發展,標志著中國人工智能技術開始具備全球競爭力。
在數據基礎設施建設領域,我國同樣取得突破性進展。截至2025年底,全國累計建成10萬余個高質量數據集,總存儲容量突破890PB,相當于中國國家圖書館數字資源總量的310倍。這些經過嚴格清洗標注的數據資產,為人工智能模型訓練提供了優質"燃料",推動行業從規模擴張轉向質量提升。
當前人工智能應用正從簡單的對話交互向復雜決策系統演進,這對詞元處理能力提出更高要求。劉烈宏表示,隨著多模態大模型和智能體技術的突破,詞元調用量將持續攀升,帶動整個產業鏈的價值重構。我國在數據要素市場建設方面的先行探索,為全球人工智能治理提供了重要參考。











