人工智能領域迎來重要進展,知名企業Anthropic通過收購動作加速完善其AI智能體技術布局。近日,該公司宣布完成對西雅圖初創公司Vercept的收購,旨在通過整合視覺理解技術突破現有產品瓶頸,推動AI協作能力向人類水平邁進。
此次收購的核心聚焦于提升AI的視覺交互能力。Vercept自主研發的視覺模型Vy展現出顯著技術優勢:該模型不依賴傳統API接口或后臺代碼,而是通過直接解析屏幕圖像識別UI元素,在ScreenSpot v1基準測試中達到92%的準確率,較同類技術實現數倍提升。這種"所見即所得"的交互方式,使AI能夠精準識別按鈕、圖標等界面組件,為復雜軟件操作奠定基礎。
技術整合將直接賦能Anthropic核心產品。其"Computer Use"功能此前受限于視覺解析精度,在跨應用協同、動態表格處理等場景表現欠佳。隨著Vercept技術注入,Claude系列產品的軟件操作能力預計實現質的飛躍,逐步接近人類用戶的操作流暢度。這種進化標志著AI從單一任務執行向全場景協作伙伴轉型。
創始團隊背景為技術落地提供保障。Vercept核心成員包括計算機視覺領域權威專家Ross Girshick,其研發團隊在三維空間推理、實時圖像解析等方面擁有深厚積累。該團隊此前獲得科技界知名投資人施密特與杰夫·迪恩的資金支持,技術路線已獲產業界認可。
商業布局呈現閉環特征。此次收購與去年12月對編碼引擎Bun的并購形成技術互補:Bun的代碼生成能力與Vercept的視覺交互能力結合,使Claude具備從代碼編寫到軟件操作的全鏈條工作能力。這種"編程+操作"的雙重技能,正在重塑AI作為數字同事的角色定位。
財務數據印證市場信心。截至2025年末,Anthropic年化營收突破90億美元,其中編程輔助工具Claude Code貢獻超四分之一收入。強勁的商業表現推動其完成300億美元G輪融資,投后估值達3800億美元,穩居全球AI企業第二位。本輪融資吸引卡塔爾投資局、摩根士丹利等頂級機構參與,顯示資本市場對其技術路線的持續看好。
行業觀察人士指出,視覺交互能力的突破將開啟AI應用新維度。傳統AI受限于文本或簡單圖形處理,而高精度視覺解析使AI能夠理解動態界面變化、處理非結構化數據,這在金融分析、醫療診斷等復雜場景具有應用潛力。Anthropic的技術整合或引發AI行業競爭格局重塑。












