套殼開源模型還裝自研,忍不了一點(diǎn),直接開噴了。
這次風(fēng)波的主角,依然是國產(chǎn)開源模型,和硅谷獨(dú)角獸玩家。
不過……雙方的站位好像發(fā)生了變化。
月之暗面預(yù)訓(xùn)練負(fù)責(zé)人杜羽倫,點(diǎn)名Cursor CEO:
Cursor既沒有遵守我們的許可協(xié)議,也沒有向我們支付任何費(fèi)用。Michael Truell,為什么?
月之暗面聯(lián)創(chuàng)周昕宇同樣下場,一記重錘錘死Cursor。
我好像不記得Cursor有來找我們申請授權(quán)。
吃瓜一線,馬斯克也站邊了:
對(duì),明明就是Kimi K2.5!
今天,Cursor也終于是給出了正式回應(yīng),承認(rèn)「自研」模型確實(shí)是套的Kimi的殼。
至于為什么沒署名嘛……
沒詳細(xì)解釋,大概意思就是不小心忘記了,實(shí)屬疏忽,下次不會(huì)再犯。
Cursor興奮發(fā)布,然后被當(dāng)場抓包要搞清楚這是怎么一回事,得先把時(shí)間線撥回到Cursor新模型發(fā)布那天。
那天的關(guān)鍵詞是「倒反天罡」。
Cursor搬出自研模型Composer 2,不僅成本低得嚇人,性能還把Claude Opus 4.6按著錘。
不過后來有眼尖的人指出,benchmark是Cursor自家的,屬于是又當(dāng)裁判又當(dāng)運(yùn)動(dòng)員了。
而且有網(wǎng)友實(shí)際體驗(yàn)下來,表示差Opus還是有點(diǎn)距離。
本來以為,這只是又一次過度宣傳,等用戶實(shí)際體驗(yàn)后,熱度就會(huì)慢慢下去。
沒想到,體驗(yàn)著體驗(yàn)著,竟然體驗(yàn)出這么個(gè)驚天大瓜。
有網(wǎng)友在Cursor里調(diào)API,結(jié)果誤打誤撞在日志中發(fā)現(xiàn):
模型那一欄,寫的是Kimi K2.5。
全網(wǎng)炸鍋。
Cursor官方發(fā)現(xiàn)后,火速阻斷了這一渠道。
但為時(shí)已晚。
消息剛出來的時(shí)候,網(wǎng)友還不太相信。Cursor這么大的公司,怎么也得提前打聲招呼吧?
畢竟Kimi雖然是開源模型,但修改版MIT新增了一條:
如果你用這個(gè)模型做商業(yè)產(chǎn)品,并且規(guī)模夠大,必須標(biāo)明Kimi K2.5.
觸發(fā)條件是滿足其一:月活超1億,或月收入超2000萬美元。
而Cursor,估值500億美元,ARR 20億,每月進(jìn)賬約1.67億,遠(yuǎn)遠(yuǎn)超過門檻。
論:Kimi如何沖刺500億美金估值?
建議:下場做個(gè)AI IDE。
調(diào)侃歸調(diào)侃,但也許……Cursor和月之暗面私下簽了什么特殊定制協(xié)議呢?
畢竟體量這么大,這也是一次重磅級(jí)的發(fā)布,應(yīng)該不至于白嫖吧???
直到月之暗面聯(lián)創(chuàng)周昕宇下場,一記重錘錘死Cursor。
我好像不記得Cursor有來找我們申請授權(quán)。
杜羽倫,得知消息后,當(dāng)即去測了Composer 2的API,隨即在技術(shù)層面給出更多證據(jù)。
結(jié)論:這模型的tokenizer,和Kimi一模一樣。
幾乎可以實(shí)錘,Cursor「暴打」Claude的最強(qiáng)自研模型,就是在Kimi基礎(chǔ)上做了一道后訓(xùn)練。
僅此而已。
對(duì)此,杜羽倫表示「難以置信」。
Cursor既沒有遵守我們的許可協(xié)議,也沒有向我們支付任何費(fèi)用。
隨即直接點(diǎn)名Cursor CEO:
Michael Truell,為什么??
輿論徹底被引爆。
大概就是在嘲諷Cursor死不承認(rèn),結(jié)果現(xiàn)在被人家抓了現(xiàn)行。
印象最深刻是這條評(píng)論,攻擊力極強(qiáng):
「如果你是套殼AI應(yīng)用,就好好當(dāng)你的模型二道販子,別裝得自己很懂模型一樣。」
如今再回頭看Cursor當(dāng)時(shí)更新「自研」模型表態(tài),確實(shí)很感慨啊:
這些性能提升,來自我們首次進(jìn)行的持續(xù)預(yù)訓(xùn)練,為后續(xù)擴(kuò)展強(qiáng)化學(xué)習(xí)提供了堅(jiān)實(shí)基礎(chǔ)。
實(shí)在有些尷尬。
Cursor此次最大的賣點(diǎn)是強(qiáng)化學(xué)習(xí),他們確實(shí)搞出了一種自我總結(jié)的RL方法,能解決上下文過長的問題。
但是,預(yù)訓(xùn)練???
哈??
誰曾想呢,幫助Cursor翻身把歌唱,把Claude壓著打的,其實(shí)是Kimi。
反轉(zhuǎn)來了?以上是昨天夜間發(fā)生的故事,等今早一覺睡醒,想不到還有新瓜可吃。
X上,周昕宇和杜羽倫的相關(guān)推文、回復(fù)全沒了。
Kimi的一條官方聲明成了唯一的回應(yīng):
恭喜Cursor團(tuán)隊(duì)發(fā)布Composer 2!我們很高興看到Kimi-k2.5成為其基礎(chǔ)模型。看到我們的模型通過 Cursor 的持續(xù)預(yù)訓(xùn)練和高算力強(qiáng)化學(xué)習(xí)訓(xùn)練被有效整合,這正是我們所支持的開放模型生態(tài)。補(bǔ)充說明:Cursor是通過FireworksAI提供的托管強(qiáng)化學(xué)習(xí)與推理平臺(tái)來訪問Kimi-k2.5的,這是一個(gè)經(jīng)過授權(quán)的商業(yè)合作關(guān)系。
不用過多翻譯,讀到這兒的你肯定已經(jīng)和我會(huì)心一笑了吧doge。
優(yōu)雅,實(shí)在太優(yōu)雅了。
隨后Cursor創(chuàng)始人Aman Sanger好像也終于想起了開源協(xié)議這件事,上來就對(duì)Kimi一頓猛夸:
我們做了很多評(píng)估,Kimi k2.5是最強(qiáng)的!
至于為什么發(fā)布博客里沒署名?
Aman Sanger沒有詳細(xì)解釋,只以滑跪結(jié)尾,說是一個(gè)失誤,并表達(dá)了歉意。
網(wǎng)友們當(dāng)然不會(huì)買賬。
這這這,Cursor在發(fā)布新模型后一頓技術(shù)解讀,又是預(yù)訓(xùn)練,又是RL的,換誰也不相信是單純忘記署名了啊。
哦,忘記說了,其實(shí)模型用的是Kimi,但我們自己做了很多技術(shù)優(yōu)化噢。
截至發(fā)帖,Cursor依然未在Composer 2的博客上補(bǔ)充任何Kimi相關(guān)說明。
One More Thing其實(shí),Cursor也不是頭一次干類似的事兒了,只是之前沒像這次被苦主用鐵錘錘死。
Composer剛出來,就有網(wǎng)友對(duì)Cursor「自研」的真實(shí)性表示過懷疑。
主要博客實(shí)在寫得太含糊了,只說用了RL、在MoE架構(gòu)上做了優(yōu)化,對(duì)模型底子完全只字不提。
Composer的透明度缺失簡直離譜。他們提到用了強(qiáng)化學(xué)習(xí),但沒交代模型的其他訓(xùn)練過程。到底是自己預(yù)訓(xùn)練的,還是拿現(xiàn)成模型改的?在他們公開更多細(xì)節(jié)、或有人能獨(dú)立復(fù)現(xiàn)結(jié)果之前,我對(duì)這些說法都持保留態(tài)度。
后面確實(shí)也被網(wǎng)友扒出來蛛絲馬跡,該模型的CoT里總是會(huì)莫名突然冒出中文;模型表現(xiàn)和智譜GLM非常相似。
面對(duì)這些質(zhì)疑,Cursor對(duì)此從沒承認(rèn),也從來沒否認(rèn)。
不過,智譜的開源協(xié)議采用的是MIT,也就是說使用其模型的產(chǎn)品,即便商用,也不對(duì)署名做強(qiáng)制要求。
其實(shí)在業(yè)內(nèi),套殼這件事對(duì)小公司來說,也很正常。
從零訓(xùn)一個(gè)coding模型,成本太高了,風(fēng)險(xiǎn)也大,為了市場還必須持續(xù)搶SOTA,算力和時(shí)間成本都不劃算。
在此背景下,好用又開源的國產(chǎn)模型,無疑成了資源受限條件下的最佳選擇。
不止初創(chuàng)公司,就連日本鬧得沸沸揚(yáng)揚(yáng)的「最強(qiáng)自研模型」Rakuten AI 3.0,也沒能撐住。
發(fā)布不到12小時(shí),就有,開源社區(qū)開發(fā)者直接在Hugging Face倉庫的config.json文件里看到:
“model_type”: “deepseek_v3”
參數(shù)規(guī)模、MoE結(jié)構(gòu)……幾乎和DeepSeek-V3一模一樣啊。
更火上澆油的是:初始上傳時(shí),樂天疑似故意沒上傳DeepSeek原有許可文件和NOTICE,只留自家Apache 2.0。
怎么說呢,「拿來主義」確實(shí)很不好……
但也算是某種對(duì)中國模型實(shí)力的側(cè)面印證吧。(量子位)










