Claude Code新增快速模式，以更高費率換取Opus 4.6低延遲回應

圖片來源:

Anthropic在Claude Code加入快速模式（Fast mode），讓使用者以偏向速度的API組態降低Claude Opus 4.6回應延遲，並在較高每Token費率下主打輸出Token生成速度最高可達約2.5倍，同時強調模型智慧與能力不變。目前功能仍屬研究預覽階段，後續可能依使用者回饋調整。

Claude Code快速模式以每百萬Token計價，並依上下文規模分成兩段。當對話上下文未滿20萬Token時，輸入每百萬Token 30美元，輸出每百萬Token 150美元，超過20萬Token則分別提高到60美元與225美元。官方也提到快速模式相容1百萬Token的延伸上下文視窗，適合用來加速長時間互動工作負載。

官方提醒，切換時機影響實際支出。要是在對話中途才啟用快速模式，系統會以快速模式的未快取輸入費率，對整段對話上下文重新計價，成本可能高於一開始就啟用的情況。因此用戶更適合在明確需要速度的會話，一開始就決定是否採用，而非臨時切換。

快速模式適用對象包括Claude Code訂閱方案用戶，以及透過Claude Console使用的開發者。對Pro、Max、Team、Enterprise等訂閱用戶而言，快速模式僅能以額外用量（Extra Usage）計費，不納入訂閱方案原本的用量上限與速率限制，因此即使帳戶仍有訂閱內含配額，快速模式仍會以額外用量另行計費，官方也要求帳戶需先啟用額外用量功能，Team與Enterprise則預設停用，必須由管理員先在組織設定中啟用後才能使用。此外，透過第三方雲端供應商Amazon Bedrock、Google Vertex AI與Microsoft Azure Foundry的使用者目前無法使用快速模式。

Anthropic表示，快速模式採用獨立於標準模式的速率限制。當使用者觸及快速模式的速率限制或額外用量額度不足時，系統會自動退回標準Opus 4.6速度並進入冷卻，待冷卻結束後再自動恢復快速模式。

熱門新聞