AIPress.com.cn報(bào)道
4月14日消息,人工智能公司Anthropic因其Claude模型性能變化,遭到開發(fā)者與重度用戶集中質(zhì)疑。多位用戶反映,模型在復(fù)雜任務(wù)中的表現(xiàn)出現(xiàn)下滑,包括指令執(zhí)行不穩(wěn)定、錯(cuò)誤率上升以及在多步驟流程中表現(xiàn)不一致。
爭(zhēng)議的核心集中在Anthropic近期對(duì)模型推理機(jī)制的調(diào)整。據(jù)公司回應(yīng),其已將Claude默認(rèn)“推理努力程度”下調(diào)至“中等”,以減少每次請(qǐng)求消耗的token數(shù)量,從而降低計(jì)算資源使用。但部分用戶認(rèn)為,這一調(diào)整直接影響了模型的思考深度與任務(wù)完成質(zhì)量。
在技術(shù)層面,token消耗與算力成本直接相關(guān)。隨著用戶規(guī)模快速增長(zhǎng),外界普遍推測(cè)Anthropic可能面臨算力資源緊張問題,尤其是在其未如部分競(jìng)爭(zhēng)對(duì)手那樣大規(guī)模鎖定數(shù)據(jù)中心資源的背景下。這一猜測(cè)進(jìn)一步引發(fā)關(guān)于“是否因算力不足而主動(dòng)降低模型性能”的討論。
Anthropic方面否認(rèn)刻意降低模型能力,并表示相關(guān)調(diào)整源于用戶反饋——此前部分用戶認(rèn)為Claude在任務(wù)中消耗token過多。公司還指出,其旗艦?zāi)P鸵岩搿白赃m應(yīng)思考”機(jī)制,可根據(jù)任務(wù)復(fù)雜度動(dòng)態(tài)調(diào)整推理強(qiáng)度。不過,部分用戶質(zhì)疑公司未充分披露關(guān)鍵變更,影響了使用預(yù)期。
爭(zhēng)議對(duì)Anthropic的商業(yè)前景構(gòu)成潛在影響。該公司近期估值已達(dá)3800億美元,并被視為可能推進(jìn)IPO的重要候選者之一。在此階段,用戶信任與產(chǎn)品穩(wěn)定性對(duì)其增長(zhǎng)路徑尤為關(guān)鍵。圍繞“透明度不足”的批評(píng),尤其觸及其長(zhǎng)期強(qiáng)調(diào)的品牌定位。
從行業(yè)角度看,類似問題并非個(gè)案。隨著AI應(yīng)用需求快速增長(zhǎng),企業(yè)普遍面臨GPU成本上升、數(shù)據(jù)中心擴(kuò)張受限等約束。在Agent需求加速的背景下,如何在性能、成本與規(guī)模之間取得平衡,成為各大模型廠商的共同挑戰(zhàn)。
值得注意的是,Anthropic近期還經(jīng)歷多次服務(wù)中斷,并在高峰時(shí)段實(shí)施更嚴(yán)格的使用限制。同時(shí),公司宣布已訓(xùn)練出新一代模型“Mythos”,其能力超越現(xiàn)有Opus系列,但因成本與安全等因素尚未全面發(fā)布。這也引發(fā)外界對(duì)其算力儲(chǔ)備與部署能力的進(jìn)一步關(guān)注。
具體到產(chǎn)品層面,爭(zhēng)議主要集中在AI編程工具Claude Code。部分開發(fā)者指出,該工具在近期更新后,從“先廣泛讀取上下文再行動(dòng)”的模式,轉(zhuǎn)向更直接的編輯方式,導(dǎo)致錯(cuò)誤增加、上下文理解不足,并需要更多人工干預(yù)。有觀點(diǎn)認(rèn)為,這種變化與推理深度下降存在關(guān)聯(lián)。
Anthropic表示,未來將測(cè)試為企業(yè)用戶默認(rèn)提供更高推理強(qiáng)度設(shè)置,以提升復(fù)雜任務(wù)表現(xiàn),即便這意味著更高的token消耗與響應(yīng)延遲。同時(shí),公司強(qiáng)調(diào)并未削弱模型核心推理能力,部分差異源于展示機(jī)制調(diào)整,例如不再向用戶完整呈現(xiàn)推理過程。(AI普瑞斯編譯)
















