3 月 23 日,中國發(fā)展高層論壇 2026 年年會上,國家數(shù)據(jù)局局長劉烈宏正式官宣:AI 領(lǐng)域核心術(shù)語 Token 的中文標準譯名確定為“詞元”。這一官方定名,結(jié)束了之前 “令牌”“代幣”“詞塊” 等譯法混用的行業(yè)亂象,為中國 AI 產(chǎn)業(yè)構(gòu)建了統(tǒng)一的技術(shù)話語體系,也讓智能時代的 “算力貨幣” 有了清晰的中國定義。至于token為什么叫詞元?我們一起來了解背后的原因!
01、從“Token”到“詞元”:指的到底是什么?
“Token”并不是新詞。早在編譯原理、網(wǎng)絡(luò)安全、區(qū)塊鏈,再到大模型時代,它一直存在——只是從未被統(tǒng)一命名。問題在于,它太“模糊”。
在大模型語境中,Token指的是模型處理文本的最小單位,可以是一個字、一個詞,甚至一個子詞片段。換言之,Token是模型處理信息的最小計量單位,無論是用戶的提問,還是AI生成的一段代碼,最終都要被拆解成Token來完成運算。正因如此,Token調(diào)用量成為衡量AI模型活躍度和產(chǎn)業(yè)價值的關(guān)鍵指標,Token調(diào)用量越高,意味模型被用得越多,創(chuàng)造的實際價值也就越大。
但不同系統(tǒng)的Token切分方式各異,語義邊界也并不穩(wěn)定,統(tǒng)一命名的需求日益迫切,“詞元”這一標準譯名便應(yīng)運而生。
官方給出的詞元定義:詞元(Token)是大模型處理信息的最小信息單元,具有智能時代可計量、可定價、可交易的特征。
作為“詞元”的Token,不僅是智能時代的價值錨點,更是連接技術(shù)供給與商業(yè)需求的“結(jié)算單位”,為AI商業(yè)模式的落地提供了可量化的支撐。
02、真正推動定名的,不是語言,而是產(chǎn)業(yè)
若將時間線拉近便會發(fā)現(xiàn),“詞元”并非突然出現(xiàn)——它早在2021年前后就已被提出,卻始終局限于技術(shù)圈。真正推動它“出圈”、成為官方標準的,源于兩件關(guān)鍵事件:
1)Token從技術(shù)指標,變成了“計費單位”
今天,大模型廠商不再只賣能力,而是賣“用量”。
輸入多少Token;
輸出多少Token;
每千Token多少錢。
Token由此第一次像“電力”“帶寬”一樣,被量化、計價、結(jié)算,官方更明確將其定義為“連接技術(shù)供給與商業(yè)需求的結(jié)算單位”。
2)規(guī)模爆炸,迫使統(tǒng)一口徑
會上披露的一組數(shù)據(jù)極具象征意義:據(jù)國家數(shù)據(jù)局統(tǒng)計,2024年初,中國日均詞元(Token)調(diào)用量僅為1000億;到2025年底,這一數(shù)字躍升至100萬億;截至今年3月,更是突破140萬億,兩年間增長超千倍。
劉烈宏指出,今年1月底以來,部分模型企業(yè)創(chuàng)下20天收入超越2025年全年總收入的業(yè)績紀錄,這組亮眼數(shù)據(jù)的背后,正是一套以Token計費為基礎(chǔ)的新型商業(yè)邏輯在加速演進。
當一個單位被用來描述國家級產(chǎn)業(yè)規(guī)模時,它就必須實現(xiàn)標準化——語言在這里,服從的是統(tǒng)計、監(jiān)管與商業(yè)需求,而非單純的語義邏輯。
03、一個被忽視的變化:話語權(quán)正在轉(zhuǎn)移
仔細觀察這次命名過程,會發(fā)現(xiàn)一個耐人尋味的變化:過去,技術(shù)術(shù)語的命名往往源于學術(shù)界或社區(qū)共識,而這一次,“詞元”的定名由官方語境直接“定錨”。
這意味著,AI時代的基礎(chǔ)概念正從“技術(shù)語言”轉(zhuǎn)向“基礎(chǔ)設(shè)施語言”。當“詞元調(diào)用量”出現(xiàn)在宏觀經(jīng)濟描述中,它便不再只是單純的工程指標,更類似于電力消耗、數(shù)據(jù)吞吐、工業(yè)產(chǎn)量,成為衡量“算力經(jīng)濟”的新核心單位。
04、產(chǎn)業(yè)側(cè)的另一種競爭:誰更“省詞元”?
隨著“詞元”成為計費與衡量核心,一個新的競爭維度正在浮現(xiàn):誰能用更少的詞元,完成同樣的任務(wù)?
這不僅關(guān)乎模型能力,也關(guān)乎產(chǎn)品設(shè)計與工程優(yōu)化。在近期的國產(chǎn)AI產(chǎn)品中,“詞元效率”已成為重要亮點:作為國內(nèi)首個中文版OpenClaw,當貝Molili molili.com.cn 在詞元消耗控制上實現(xiàn)重大突破,其詞元消耗相較OpenClaw原版節(jié)省一半,有效解決了原版產(chǎn)品“詞元消耗過高”的行業(yè)痛點。
據(jù)當貝Molili研發(fā)團隊介紹,這一成本優(yōu)勢并非簡單的漢化適配,而是基于底層技術(shù)的深度優(yōu)化:通過動態(tài)調(diào)整上下文窗口,避免小任務(wù)無效詞元消耗;精簡非必要通用信息,提升詞元利用效率;優(yōu)化提示詞工程,提高緩存命中率,最終在不影響任務(wù)處理質(zhì)量的前提下,實現(xiàn)了詞元消耗的大幅降低。
從“更聰明”到“更省詞元”,AI競爭的重心正在發(fā)生轉(zhuǎn)移。
05、token定名詞元:這不是翻譯,是一次“命名權(quán)確認”
回看“詞元”定名這一事件,其背后至少蘊含著三層核心意義:
1)語言層
中文世界第一次為AI核心單位建立起統(tǒng)一、規(guī)范的表達,終結(jié)了長期以來的譯法亂象。
2)產(chǎn)業(yè)層
“詞元”正式成為AI時代的基礎(chǔ)計量單位,為產(chǎn)業(yè)發(fā)展、商業(yè)計費提供了統(tǒng)一參照。
3)權(quán)力層
技術(shù)術(shù)語的命名權(quán),從過去的技術(shù)社區(qū),正式轉(zhuǎn)向國家與產(chǎn)業(yè)體系,彰顯了中國AI產(chǎn)業(yè)的自主話語權(quán)。
綜上,token為什么叫詞元?其原因遠不止于術(shù)語規(guī)范,更將推動AI產(chǎn)業(yè)商業(yè)化進程走向標準化、規(guī)范化。統(tǒng)一的詞元標準,讓算力成本核算、AI服務(wù)定價、產(chǎn)業(yè)價值量化有了統(tǒng)一參照;而當貝Molili等本土產(chǎn)品的技術(shù)突破,也凸顯了我國AI本土化創(chuàng)新的實力,為中小企業(yè)和普通用戶降低AI使用成本、推動AI普惠化提供了可能。











