在2026年英偉達(dá)GTC大會(huì)上,月之暗面Kimi創(chuàng)始人楊植麟通過公開演講,深入探討了人工智能大模型發(fā)展的技術(shù)路徑。他指出,當(dāng)前大模型智能水平的提升已進(jìn)入關(guān)鍵階段,突破現(xiàn)有瓶頸需要從底層架構(gòu)入手,對(duì)優(yōu)化器設(shè)計(jì)、注意力機(jī)制優(yōu)化及殘差連接等核心組件進(jìn)行系統(tǒng)性重構(gòu)。這種重構(gòu)并非簡單調(diào)整參數(shù),而是通過重新定義計(jì)算單元間的交互方式,為模型智能上限的突破提供新的可能性。
楊植麟首次完整披露了Kimi K2.5模型的技術(shù)演進(jìn)框架,將其發(fā)展策略概括為三個(gè)相互支撐的技術(shù)維度。在Token效率層面,模型通過動(dòng)態(tài)壓縮算法將信息密度提升40%,同時(shí)保持語義完整性;長上下文處理方面,采用分層記憶架構(gòu)使模型能夠穩(wěn)定處理超過百萬token的輸入;智能體集群技術(shù)則通過構(gòu)建動(dòng)態(tài)協(xié)作網(wǎng)絡(luò),使多個(gè)專用模型能夠根據(jù)任務(wù)需求自動(dòng)組合成最優(yōu)解。這三個(gè)維度的技術(shù)突破形成乘數(shù)效應(yīng),推動(dòng)模型整體性能呈現(xiàn)指數(shù)級(jí)提升。
針對(duì)行業(yè)關(guān)注的模型擴(kuò)展問題,楊植麟提出"三維Scaling"新范式。他強(qiáng)調(diào),單純?cè)黾佑?jì)算資源或模型參數(shù)的傳統(tǒng)方式已觸及邊際效益遞減點(diǎn),未來需要同時(shí)優(yōu)化計(jì)算效率、記憶容量和協(xié)作機(jī)制。通過將這三個(gè)關(guān)鍵要素進(jìn)行協(xié)同擴(kuò)展,模型能夠在相同算力消耗下實(shí)現(xiàn)更顯著的智能提升。這種技術(shù)路線已在Kimi K2.5的研發(fā)中得到驗(yàn)證,實(shí)測數(shù)據(jù)顯示其綜合性能較前代提升2.3倍。
在演講最后部分,楊植麟對(duì)人工智能形態(tài)的演進(jìn)方向作出判斷。他認(rèn)為,隨著多模態(tài)交互需求的增長,未來智能系統(tǒng)將從單體架構(gòu)向動(dòng)態(tài)集群架構(gòu)轉(zhuǎn)變。這種轉(zhuǎn)變不僅體現(xiàn)在模型數(shù)量的增加,更重要的是形成能夠自主感知環(huán)境、分配任務(wù)、協(xié)同決策的智能網(wǎng)絡(luò)。Kimi團(tuán)隊(duì)正在研發(fā)的Agent Swarms技術(shù),正是通過構(gòu)建去中心化的智能體協(xié)作框架,為這種轉(zhuǎn)型提供技術(shù)儲(chǔ)備。目前該技術(shù)已在復(fù)雜任務(wù)分解、實(shí)時(shí)決策等場景中展現(xiàn)出初步優(yōu)勢(shì)。











