2 月 8 日消息,Claude Code 推出快速模式(Fast mode)研究預覽版。該模式通過優化 Opus 4.6 的 API 配置,在保持模型質量不變的前提下顯著降低響應延遲。
官方稱,快速模式并非獨立模型,其仍使用相同的 Opus 4.6 模型,僅采用不同的 API 配置,優先保障速度而非成本效益。響應質量與功能完全一致,僅響應速度更快。
Fast mode 適用于 Pro、Team 等訂閱用戶及 Console 用戶,需通過“額外用量”計費。第三方提供商 Amazon Bedrock、Google Vertex AI 和 Microsoft Azure Foundry 均不支持快速模式。
目前該模式定價為每百萬 Token 輸入 30 美元、輸出 150 美元。太平洋時間 2 月 16 日晚上 11:59 前,所有方案均可享受 50% 的限時折扣。
此前報道,2 月 6 日 Anthropic 發布了新一代 Claude Opus 4.6 模型,支持 200K 上下文窗口(測試版提供 100 萬 token),最大輸出 token 數提升至 128K,較前代 64K 限制翻倍。該模型引入自適應思考模式,可根據問題復雜度動態調整思考深度,并新增最高級別的 max effort 參數。新版本還推出上下文壓縮功能,當對話接近窗口限制時自動總結早期內容,實現近乎無限長度的對話。







