美國AI企業Anthropic近日公開指責三家中國大模型廠商DeepSeek、Kimi和MiniMax通過虛假賬戶大規模調用其Claude模型接口,利用輸出結果優化自身技術。這一指控將AI行業長期存在的"模型蒸餾"爭議推向臺前,引發關于技術倫理與商業規則的激烈討論。
在AI技術領域,"蒸餾"本指用高性能模型指導低性能模型訓練的常規手段。全球AI開源社區亞太生態負責人王鐵震透露,利用商業模型生成訓練數據已成為行業"潛規則",但多數企業會在服務條款中明令禁止此類行為用于開發競爭產品。硅基流動聯合創始人楊攀以"學霸筆記"作比:優秀模型公開輸出結果如同學霸分享筆記,其他企業借鑒提升類似學渣抄筆記提高成績,這種行為是否構成侵權存在爭議。
開發者社區對此呈現兩極分化態度。部分開發者認為大規模注冊虛假賬號獲取數據違反商業契約,破壞公平競爭環境;另有聲音質疑Anthropic雙重標準,指出其訓練數據同樣包含未獲授權的互聯網內容。埃隆·馬斯克更在社交平臺嘲諷:"他們怎么敢偷Anthropic從人類程序員那里偷來的東西?"
涉事企業尚未對此作出正式回應。但技術專家指出,海外模型廠商憑借資金優勢構建的數據壁壘,正成為制約中國AI發展的關鍵因素。負責海外業務的工程師李軒算了一筆賬:標注一套國際數學奧林匹克競賽級別的題目需投入數千萬元,單題成本超萬元。而MiniMax被指控的1300萬次API調用,按市場價格計算成本可達數億元,這對連續三年虧損超12億美元的MiniMax而言難以承受。
數據標注產業的差距更為顯著。李軒透露,國內能準確解答IMO級數學題的專家不足百人,高端標注人才稀缺導致成本居高不下。相比之下,海外廠商可為單道錯題衍生100道變式題進行標注,這種極致標注模式國內企業根本無力復制。算力限制則構成另一重困境,美國對高端GPU的出口管制使國內訓練依賴英偉達芯片的企業面臨"有錢買不到卡"的尷尬。
技術路徑選擇同樣折射出成本考量。當KimiK2宣布開源且架構與DeepSeekV3高度相似時,團隊坦言曾嘗試多種創新結構,但始終無法在核心指標上超越現有方案。李軒指出,自研新架構需要承擔高額實驗成本與失敗風險,借鑒成熟架構成為資源有限企業的理性選擇。這種"性價比優先"的策略,在基礎研究薄弱、工程化能力突出的中國AI產業中尤為普遍。
行業正在探索破局之道。有企業管理層透露,當通用模型領域的"蒸餾"價值逐漸耗盡,聚焦垂直場景成為新方向。中文處理、政務服務、醫療健康等細分領域,正成為國產模型突破數據壁壘的試驗場。李軒觀察到,國內企業在高效訓練、小樣本學習等基礎研究領域已取得進展,部分成果甚至能反哺全球模型架構創新。
這場爭議暴露出AI技術全球化的深層矛盾:當開源精神遭遇商業競爭,當數據流動碰撞知識產權,行業亟需建立新的規則體系。正如某企業技術負責人所言:"如果所有從業者都滿足于蒸餾現有模型,AI技術終將陷入近親繁殖的死循環。"在技術迭代與商業利益的博弈中,中國AI企業正在尋找屬于自己的破局之路。







