从“Token狂欢”到“Token配给”
过去一年,许多公司经历了短暂的“Token狂欢”时期——员工们用ChatGPT、Claude等AI工具写邮件、做摘要、改PPT甚至编笑话,仿佛AI资源取之不尽。但TechCrunch最新报道指出,这股狂热正在被紧急刹车。企业突然意识到,每个看似微小的API调用背后,都是实打实的金钱支出。当财务部门看到月度账单上数十万美元的AI费用时,大规模的预算管控行动立即展开。
小任务如何烧掉大预算?
表面上,让AI帮忙润色一段文字或生成一个表格只消耗几美分,但乘以数千员工、每日数百次请求,成本就变得触目惊心。一位不愿具名的科技公司CTO向TechCrunch透露:“我们发现员工平均每天要用AI完成超过50次微小操作,其中80%根本不需要AI参与——比如把‘你好’改成‘您好’这种格式调整。但每个请求都要经过GPT-4级别的模型,算力成本远高于实际价值。”这种现象被业内称为“Token渗漏”——大量预算被用于替代人类几秒钟就能完成的小事。
“Tokenmaxxing时代是短暂的。我们现在似乎正在进入Token配给时代。”——TechCrunch报道原文
企业出手:配额、层过滤与审计
为了应对失控的支出,企业开始祭出多种手段。最直接的做法是给每位员工设定每日或每周的Token配额,超出部分要么自费,要么等待审批。一些公司则引入“任务分诊”系统:先由轻量级模型判断请求是否真的需要调用高端AI,若只是简单拼写检查,直接驳回。科技巨头微软和谷歌也在企业版AI工具中增加了费用仪表盘和阈值警报,帮助管理层实时监控消耗。
编者按:这其实是企业数字化转型中常见的“过度适应”现象——新工具刚引入时,员工因新奇而滥用,管理层则因缺乏使用规范而放任。但随着AI成本透明化,企业必须学会像管理云资源一样管理AI资源。不是所有任务都值得让价值千亿参数的大模型处理,合理分层使用才是长久之计。
未来趋势:AI使用的“热力学定律”
可以预见,这场配额运动将推动两个方向的发展:一是更多企业采用“边缘AI”或专用小型模型来处理简单任务,既降低单次成本,也保护隐私;二是催生新的软件类别——AI费用管理平台,类似于多年前的云计算成本优化工具。正如一位分析师所言:“Token就像新的CPU周期,只不过更贵、更无形。企业需要重新学习如何精打细算。”对于员工来说,这可能意味着需要思考每次问AI“今天天气如何”是否真的值得——至少在老板看得见的账单上。
本文编译自TechCrunch
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接