在中關(guān)村國際創(chuàng)新中心,一場聚焦大模型行業(yè)變革的討論吸引了眾多目光。此次論壇匯聚了月之暗面創(chuàng)始人楊植麟、智譜CEO張鵬、無問芯穹創(chuàng)始人夏立雪、小米MiMo負(fù)責(zé)人羅福莉以及香港大學(xué)助理教授黃超等業(yè)內(nèi)核心人物,他們圍繞近期行業(yè)熱點“OpenClaw”展開了深入探討。
過去一個月,OpenClaw成為行業(yè)焦點,它幾乎重塑了大模型的調(diào)用格局。智譜、Kimi以及小米MiMo等多家模型廠商都從中受益。3月下旬,在全球最大的模型API聚合平臺OpenRouter上,一款名為Hunter Alpha的模型調(diào)用量迅速登頂,隨后小米確認(rèn)該模型正是MiMo - V2 - Pro。OpenClaw帶來的影響遠(yuǎn)不止調(diào)用量的增長,它讓行業(yè)清晰地看到大模型進(jìn)入實際應(yīng)用階段后,技術(shù)與商業(yè)邏輯正發(fā)生深刻改變。
在討論中,模型承擔(dān)“完整任務(wù)鏈路”成為重要話題。過去,用戶向大模型提問,大模型僅作答,任務(wù)鏈路斷裂。如今,OpenClaw將模型引入任務(wù)執(zhí)行環(huán)節(jié),用戶給出目標(biāo),系統(tǒng)負(fù)責(zé)拆解、嘗試、修正和交付。張鵬將其比作“腳手架”,普通人可借此調(diào)用頂級模型完成完整任務(wù),用戶與模型的關(guān)系從“提問—回答”轉(zhuǎn)變?yōu)椤澳繕?biāo)—執(zhí)行—迭代”。這一轉(zhuǎn)變改變了評價方式,單輪回答不再重要,復(fù)雜任務(wù)能否穩(wěn)定收斂成為關(guān)鍵,模型被置于交付結(jié)果的語境中,系統(tǒng)規(guī)劃、調(diào)度和試錯消耗時間,也堆疊了能力。
Token的變化也備受關(guān)注。夏立雪提到,公司Token用量從1月底開始每兩周翻一倍,在Agent場景下,單個任務(wù)的Token消耗是傳統(tǒng)問答的10倍甚至100倍。過去,大模型對話問答時代,Token消耗量低,普通用戶免費就能使用AI。但OpenClaw出現(xiàn)后,Token用量呈指數(shù)增長成為新共識,其消耗量遠(yuǎn)高于傳統(tǒng)對話。不過,Token不再只是成本指標(biāo),它對應(yīng)規(guī)劃、執(zhí)行、調(diào)用工具的全過程,接近“機器工時”,將重塑價格體系,成本上升與任務(wù)價值綁定,成為新的定價基礎(chǔ)。
大模型行業(yè)正從訓(xùn)練時代快速邁向推理時代。在智譜、MiniMax等大模型公司未上市階段,“訓(xùn)練”曾是主流,但OpenClaw加速了推理時代的到來。隨著任務(wù)復(fù)雜度上升,Context長度迅速拉長到1M甚至10M級別,這促使廠商在推理側(cè)進(jìn)行結(jié)構(gòu)創(chuàng)新,如Hybrid架構(gòu)、Linear Attention、Long Context Efficient設(shè)計等,目的是在更長Context下降低成本、提高穩(wěn)定性。這也意味著競爭維度下沉,從模型參數(shù)規(guī)模轉(zhuǎn)向推理效率、系統(tǒng)調(diào)度甚至能源成本。
在Agent框架下,系統(tǒng)能力開始抵消模型差距。模型之間的能力差距被部分壓縮,通過Skill和工具組合,次頂級模型也能完成復(fù)雜任務(wù)。此時,用戶更關(guān)注任務(wù)結(jié)果,而非模型本身指標(biāo),參與門檻降低,構(gòu)建能力向系統(tǒng)工程傾斜,不再局限于算法。
對于OpenClaw,各位嘉賓發(fā)表了不同看法。楊植麟提出,大家在日常使用或類似產(chǎn)品時,覺得什么最有想象力或印象深刻,并請張鵬從技術(shù)角度談?wù)剬penClaw和相關(guān)Agent的看法。張鵬認(rèn)為它是一個“腳手架”,為在模型基礎(chǔ)上搭建提供了牢固、方便且靈活的可能性,普通人能極低門檻使用頂尖模型,尤其是編程和整體能力,這是重大突破。夏立雪起初不適應(yīng)OpenClaw,覺得它慢,后來發(fā)現(xiàn)能完成大型任務(wù),從按Token聊天到能完成任務(wù)的Agent,想象力空間提升,但對系統(tǒng)能力要求增大,作為基礎(chǔ)設(shè)施廠商,看到機遇和挑戰(zhàn),資源需支撐快速增長時代。羅福莉認(rèn)為OpenClaw具有革命性和顛覆性,在Agent框架設(shè)計上領(lǐng)先于Code,其“開源”有利于社區(qū)參與,拉高了國內(nèi)次頂級閉源模型上限,保證了任務(wù)完成度下限,還點燃了大家想象力,讓更多人參與AGI變革。黃超表示,OpenClaw在交互模式上給人“更有活人感”的體驗,更接近個人賈維斯,還證明了架構(gòu)Agent的框架可簡單高效,讓大家思考是否需要All in one的超級智能體,撬動生態(tài)工具賦能各行各業(yè)。
討論中,楊植麟還詢問張鵬智譜新發(fā)布的GLM Turbo模型情況。張鵬稱發(fā)布Turbo是為了讓大模型從“簡單對話”轉(zhuǎn)向“干活”,OpenClaw讓大家看到大模型能干活,但背后Token消耗高,需要規(guī)劃、嘗試等,Turbo在這些方面優(yōu)化,本質(zhì)是多智能體協(xié)同架構(gòu),能力上有偏向性加強。關(guān)于提價,他解釋因干活消耗的Token量是簡單問答的10倍甚至100倍,成本大幅提高,長期低價競爭不利于行業(yè)發(fā)展,調(diào)整價格是為回歸正常商業(yè)價值,持續(xù)優(yōu)化模型提供更好服務(wù)。
當(dāng)被問到小米做大模型的優(yōu)勢時,羅福莉先談了中國大模型團(tuán)隊的優(yōu)勢。兩年前,中國團(tuán)隊在算力受限,尤其是互聯(lián)帶寬受限的情況下,通過模型結(jié)構(gòu)創(chuàng)新(如DPCV3、M1、MA等)追求最高效率,這給了團(tuán)隊勇氣和信心。如今國產(chǎn)芯片不再受限,但對高效率、低推理成本的探索依然重要,如現(xiàn)在的Hybrid、SPA、Linear attention結(jié)構(gòu)等。結(jié)構(gòu)創(chuàng)新重要是因為OpenClaw越用越聰明的前提是推理Context,難題是在1M或10M的長上下文下做到成本低、速度快,以激發(fā)高生產(chǎn)力任務(wù),實現(xiàn)模型自迭代。小米正在探索Long Context Efficient架構(gòu),以及在真實長距離任務(wù)上做到穩(wěn)定和高上限。更長期看,隨著推理需求爆發(fā),今年可能增長100倍,競爭維度將下探到算力、推理芯片甚至能源層面。










