Anthropic原计划于本周一对其Claude Agent SDK推出基于token的计费模式,但这一变动在最后一刻被紧急叫停。据Ars Technica报道,该计费方式旨在替代原有的固定费率或按请求次数计费,转而根据模型处理的token数量进行精确收费。然而,对于频繁调用深度推理或长上下文任务的高用量用户而言,这一变动可能使成本飙升数倍。
计费变更背景:从“固定”到“按量”的冒险
Claude Agent SDK是Anthropic为企业用户提供的智能代理开发工具包,支持多步骤推理、工具调用和长文档处理。此前,Anthropic主要采用按API调用次数或订阅套餐的方式收费。而基于token的计费模型在行业中并不新鲜——OpenAI、Google等公司早已采用类似方式,用户需为输入和输出的每个token付费。但Anthropic的尝试之所以引发争议,在于其Agent SDK的独特工作流:智能代理在复杂任务中可能产生大量中间推理token,而这些token在旧模式下并不单独计费。
“我们理解开发者需要可预测的成本,但token计费的初衷是让费用与使用强度真正挂钩。”Anthropic发言人在一份声明中表示。
然而,许多开发者对此并不买账。一位资深AI工程师在社交媒体上指出,自己的团队正在用Claude Agent SDK构建多轮客服机器人,每个会话平均消耗超过1万token,若按新计费机制,月费将从现在的2000美元飙升至近1.5万美元。“这几乎是在惩罚那些真正把模型用好的用户。”该工程师评论道。
行业视角:定价权博弈与开发者信任
Anthropic的暂时后退并非孤例。2024年,OpenAI曾因调整GPT-4 API的速率限制和计费粒度引发大规模开发者抗议,最终同样采取了部分妥协措施。AI模型提供商在追求商业可持续性的同时,不得不面对开发者社区对成本透明度和可预测性的强硬要求。本次事件中,Anthropic的快速反应(宣布暂停)被认为是一种明智之举——在正式执行前预留了沟通窗口。
编者按:暂停不等于放弃
尽管Anthropic目前暂停了计费变更,但业内普遍认为,按token计费仍是长期趋势。随着模型推理成本下降和竞争加剧,平台方需要更精细的计量手段来区分不同使用场景。关键问题在于,如何设计一个既能激励高效使用、又不至于扼杀创新探索的定价体系。Anthropic可能需要借鉴AWS的“预留实例”或“阶梯定价”思路,让高用量用户获得批量折扣。
对于开发者而言,这是一次重要的胜利,但不应掉以轻心。未来,Anthropic极有可能推出修订版计费方案,届时或许会设置token消耗上限、免费额度或混合付费模式。在关注自身成本的同时,开发者也应积极与平台方沟通,共同塑造符合行业长远利益的定价范式。
本文编译自Ars Technica
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接