Anthropic紧急叫停Claude Agent SDK按token计费计划

Anthropic紧急叫停Claude Agent SDK按token计费计划
Anthropic原定于周一推出的基于token的计费模式,旨在为Claude Agent SDK提供更精细的用量控制,但该计划因可能导致高用量用户成本激增而引发争议。在开发者社区的强烈反对下,Anthropic宣布暂停该计费变更,并表示将重新评估定价模型。此举反映了AI平台在平衡盈利与开发者友好之间的普遍挑战。

Anthropic原计划于本周一对其Claude Agent SDK推出基于token的计费模式,但这一变动在最后一刻被紧急叫停。据Ars Technica报道,该计费方式旨在替代原有的固定费率或按请求次数计费,转而根据模型处理的token数量进行精确收费。然而,对于频繁调用深度推理或长上下文任务的高用量用户而言,这一变动可能使成本飙升数倍。

计费变更背景:从“固定”到“按量”的冒险

Claude Agent SDK是Anthropic为企业用户提供的智能代理开发工具包,支持多步骤推理、工具调用和长文档处理。此前,Anthropic主要采用按API调用次数或订阅套餐的方式收费。而基于token的计费模型在行业中并不新鲜——OpenAI、Google等公司早已采用类似方式,用户需为输入和输出的每个token付费。但Anthropic的尝试之所以引发争议,在于其Agent SDK的独特工作流:智能代理在复杂任务中可能产生大量中间推理token,而这些token在旧模式下并不单独计费。

“我们理解开发者需要可预测的成本,但token计费的初衷是让费用与使用强度真正挂钩。”Anthropic发言人在一份声明中表示。

然而,许多开发者对此并不买账。一位资深AI工程师在社交媒体上指出,自己的团队正在用Claude Agent SDK构建多轮客服机器人,每个会话平均消耗超过1万token,若按新计费机制,月费将从现在的2000美元飙升至近1.5万美元。“这几乎是在惩罚那些真正把模型用好的用户。”该工程师评论道。

行业视角:定价权博弈与开发者信任

Anthropic的暂时后退并非孤例。2024年,OpenAI曾因调整GPT-4 API的速率限制和计费粒度引发大规模开发者抗议,最终同样采取了部分妥协措施。AI模型提供商在追求商业可持续性的同时,不得不面对开发者社区对成本透明度和可预测性的强硬要求。本次事件中,Anthropic的快速反应(宣布暂停)被认为是一种明智之举——在正式执行前预留了沟通窗口。

编者按:暂停不等于放弃

尽管Anthropic目前暂停了计费变更,但业内普遍认为,按token计费仍是长期趋势。随着模型推理成本下降和竞争加剧,平台方需要更精细的计量手段来区分不同使用场景。关键问题在于,如何设计一个既能激励高效使用、又不至于扼杀创新探索的定价体系。Anthropic可能需要借鉴AWS的“预留实例”或“阶梯定价”思路,让高用量用户获得批量折扣。

对于开发者而言,这是一次重要的胜利,但不应掉以轻心。未来,Anthropic极有可能推出修订版计费方案,届时或许会设置token消耗上限、免费额度或混合付费模式。在关注自身成本的同时,开发者也应积极与平台方沟通,共同塑造符合行业长远利益的定价范式。

本文编译自Ars Technica