大模型競爭格局再度洗牌。根據(jù)最新發(fā)布的 Artificial Analysis 智能指數(shù),Anthropic 的旗艦?zāi)P虲laude Opus4.6憑借卓越的表現(xiàn)力壓群雄,正式登頂該權(quán)威排行榜。這一指數(shù)綜合了編程、代理任務(wù)和科學(xué)推理等十項深度測試,Opus4.6在代理類工作任務(wù)、終端編程以及物理研究課題上均斬獲第一。
值得關(guān)注的是,盡管 Opus4.6的運(yùn)行成本高達(dá)2,486美元,略高于 OpenAIGPT-5.2的2,304美元,但在效率表現(xiàn)上卻呈現(xiàn)出顯著差異。數(shù)據(jù)顯示,Opus4.6在測試過程中消耗了約5,800萬個輸出 Token,雖然這一數(shù)字是前代機(jī)型4.5的兩倍,但相較于 GPT-5.2驚人的1.3億個 Token,Opus4.6顯然在信息密度和處理邏輯上更為精簡。目前,該模型已全面上線Claude.ai平臺,并支持通過 Google Vertex、AWS Bedrock 等主流云服務(wù)進(jìn)行調(diào)用。
然而,Anthropic 的領(lǐng)先地位正面臨嚴(yán)峻挑戰(zhàn)。行業(yè)巨頭 OpenAI 的新一代編程利器Codex5.3已在備測名單中。分析人士指出,一旦 Codex5.3完成所有基準(zhǔn)測試,其在代碼編寫及相關(guān)邏輯領(lǐng)域的優(yōu)勢極有可能助其重奪王座。這場“全球最聰明模型”的拉鋸戰(zhàn),遠(yuǎn)未到蓋棺論定的時候。











