人工智能公司Anthropic近日推出其Sonnet系列模型的最新版本——Sonnet 4.6測(cè)試版,標(biāo)志著該公司每四個(gè)月一次的模型迭代周期持續(xù)推進(jìn)。此次更新重點(diǎn)強(qiáng)化了代碼生成、復(fù)雜指令處理及計(jì)算機(jī)交互能力,同時(shí)將上下文窗口容量擴(kuò)展至100萬(wàn)token,相當(dāng)于可一次性解析完整代碼庫(kù)或數(shù)十篇學(xué)術(shù)論文。
新模型將作為免費(fèi)用戶(hù)和專(zhuān)業(yè)版用戶(hù)的默認(rèn)選擇,其上下文處理能力較前代提升一倍。Anthropic技術(shù)團(tuán)隊(duì)指出,這種擴(kuò)展使得模型能夠處理更復(fù)雜的任務(wù)場(chǎng)景,例如分析長(zhǎng)篇法律文書(shū)或跨文件代碼審查。值得注意的是,該版本發(fā)布距離旗艦?zāi)P蚈pus 4.6的推出僅間隔兩周,顯示出公司加速技術(shù)落地的戰(zhàn)略節(jié)奏。
在性能測(cè)試中,Sonnet 4.6在多項(xiàng)專(zhuān)業(yè)基準(zhǔn)上刷新紀(jì)錄。其中在計(jì)算機(jī)操作評(píng)估平臺(tái)OS World和軟件工程測(cè)試集SWE-Bench上均取得突破性進(jìn)展,更在衡量通用智能的ARC-AGI-2測(cè)試中達(dá)到60.4%的準(zhǔn)確率。盡管這一成績(jī)超越了同規(guī)模競(jìng)品,但與Opus 4.6、Gemini 3 Deep Think等頂級(jí)模型仍存在差距,某精調(diào)版GPT 5.2也保持領(lǐng)先優(yōu)勢(shì)。
據(jù)內(nèi)部人士透露,輕量級(jí)Haiku模型的升級(jí)版本正在進(jìn)行最終測(cè)試,預(yù)計(jì)將在未來(lái)三周內(nèi)完成部署。這種多層級(jí)模型協(xié)同更新的策略,顯示出Anthropic構(gòu)建完整AI產(chǎn)品矩陣的野心。隨著上下文處理能力的突破,專(zhuān)業(yè)開(kāi)發(fā)者群體對(duì)Sonnet 4.6的部署應(yīng)用表現(xiàn)出濃厚興趣,部分金融機(jī)構(gòu)已啟動(dòng)內(nèi)部測(cè)試。











