
Anthropic在Claude Code加入快速模式(Fast mode),讓使用者以偏向速度的API組態降低Claude Opus 4.6回應延遲,並在較高每Token費率下主打輸出Token生成速度最高可達約2.5倍,同時強調模型智慧與能力不變。目前功能仍屬研究預覽階段,後續可能依使用者回饋調整。
Claude Code快速模式以每百萬Token計價,並依上下文規模分成兩段。當對話上下文未滿20萬Token時,輸入每百萬Token 30美元,輸出每百萬Token 150美元,超過20萬Token則分別提高到60美元與225美元。官方也提到快速模式相容1百萬Token的延伸上下文視窗,適合用來加速長時間互動工作負載。
官方提醒,切換時機影響實際支出。要是在對話中途才啟用快速模式,系統會以快速模式的未快取輸入費率,對整段對話上下文重新計價,成本可能高於一開始就啟用的情況。因此用戶更適合在明確需要速度的會話,一開始就決定是否採用,而非臨時切換。
快速模式適用對象包括Claude Code訂閱方案用戶,以及透過Claude Console使用的開發者。對Pro、Max、Team、Enterprise等訂閱用戶而言,快速模式僅能以額外用量(Extra Usage)計費,不納入訂閱方案原本的用量上限與速率限制,因此即使帳戶仍有訂閱內含配額,快速模式仍會以額外用量另行計費,官方也要求帳戶需先啟用額外用量功能,Team與Enterprise則預設停用,必須由管理員先在組織設定中啟用後才能使用。此外,透過第三方雲端供應商Amazon Bedrock、Google Vertex AI與Microsoft Azure Foundry的使用者目前無法使用快速模式。
Anthropic表示,快速模式採用獨立於標準模式的速率限制。當使用者觸及快速模式的速率限制或額外用量額度不足時,系統會自動退回標準Opus 4.6速度並進入冷卻,待冷卻結束後再自動恢復快速模式。
熱門新聞
2026-03-02
2026-03-02
2026-03-02
2026-03-02
2026-03-02
2026-03-02
2026-03-03