美國知名人工智能企業Anthropic近日宣布完成對視覺驅動型計算機自動化初創公司Vercept的收購,此舉旨在強化其大模型Claude的計算機操控能力。作為繼2025年12月收購全棧工具鏈公司Bun后的第二筆戰略投資,此次收購將重點補足Claude在視覺交互領域的技術短板。
Claude的Computer Use功能于2024年10月隨3.5 Sonnet版本推出,該技術使模型能夠通過模擬人類操作完成跨軟件的多步驟任務,包括編寫代碼庫、整合多源研究數據以及管理跨團隊協作流程。然而早期版本在視覺精度、動態界面識別和復雜場景處理方面存在局限,導致任務完成率未達預期。Vercept在UI高精度識別、空間推理算法和低延遲視覺處理等領域的技術積累,恰好能解決這些痛點問題。
成立于西雅圖的Vercept由艾倫人工智能研究所(AI2)核心團隊創立,其開發的"無API自動化"技術通過直接解析屏幕像素實現軟件操控。這家定位"視覺優先"的AI Agent公司,在2025年1月完成1600萬美元種子輪融資時即獲得谷歌前CEO埃里克·施密特、DeepMind首席科學家杰夫·迪恩等科技界重量級人物投資,累計融資規模達5000萬美元。
根據收購協議,Vercept的桌面應用Vy將在30天內停止服務,用戶將被引導遷移至Claude平臺。公司聯合創始人盧卡·韋斯指出,此次整合將推動人機交互范式變革,未來知識型工作的完成方式可能達到當前代碼編寫能力的同等水平。這種轉變要求交互體驗與底層模型能力保持同步發展。
行業觀察人士注意到,AI Agent領域的競爭正呈現白熱化態勢。OpenAI在2月中旬通過引入OpenClaw創始人彼得·斯坦伯格加強個人端布局,采用"人才加盟+資源贊助"的輕資產模式,與Anthropic的企業級戰略形成差異化競爭。兩家公司雖路徑不同,但都瞄準了具備計算機通用控制權的閉環執行系統這一終極目標。
Anthropic創始人達里奧·阿莫迪在近期訪談中強調,AI發展的關鍵突破口在于交互可靠性而非單純智力提升。當前模型已具備完成復雜生產任務的能力,但穩定執行仍面臨挑戰。通過整合長上下文記憶與計算機視覺控制,未來三年內將有大量需要現場學習的崗位被AI替代,這種轉變將重塑知識型工作的完成方式。







