据TechCrunch独家报道,知情人士透露,AI推理初创公司Baseten正接近完成一笔高达15亿美元的融资轮,公司估值随之攀升至130亿美元。值得注意的是,距离其上一轮大型融资仅过去数月——2025年底Baseten曾完成9亿美元融资,估值约80亿美元。短短半年内估值暴涨超60%,折射出资本市场对AI推理赛道的疯狂追捧。
推理黄金热:AI下半场的核心战场
Baseten成立于2021年,总部位于旧金山,核心业务是为大语言模型提供高效的推理(Inference)基础设施。在AI产业链中,训练阶段已涌现出OpenAI、Anthropic等巨头,而推理阶段作为模型实际落地应用的“最后一公里”,正成为下一个兵家必争之地。随着GPT-4o、Claude 3.5等模型参数规模持续膨胀,企业对低延迟、高吞吐的推理需求呈指数级增长。Baseten通过自研的推理引擎和GPU集群调度技术,帮助客户将推理成本降低40%以上,同时保证响应速度。
“推理基础设施是AI从玩具变成工具的桥梁。没有它,再强大的模型也只是实验室里的展品。” —— Baseten创始人兼CEO Tuhin Srivastava 此前在采访中表示。
本轮融资由多家顶级风投联合注资,包括原有投资者Lightspeed Venture Partners、Sequoia Capital,以及新进投资者Fidelity、T. Rowe Price等。值得注意的是,估值抬升的同时,Baseten并未披露盈利能力,其营收规模尚未公开,但据第三方估算,公司年度经常性收入(ARR)可能已突破3亿美元,主要来自按需付费和预留实例两种商业模式。
行业竞速:谁在争夺推理蛋糕?
Baseten并非孤军奋战。Together AI、Fireworks AI、Replicate等同类公司同样在加速融资。2026年5月,Together AI完成7亿美元融资,估值90亿美元;Fireworks AI也于近期斩获5亿美元。这些公司的共同点在于:提供比主流云厂商(AWS、Azure、GCP)更廉价、更灵活的推理服务,并且对VLLM、TensorRT等开源框架有深度优化。此外,英伟达也在通过NeMo和TensorRT-LLM等工具切入推理优化市场,但其云端服务并不直接与初创公司竞争。
从融资节奏看,2026上半年全球AI推理基础设施赛道累计融资已超400亿美元,超过2025年全年总额。这源于两个驱动力:一是多模态模型和Agent应用的爆发,推理调用量呈10倍级增长;二是推理成本仍占AI应用总成本的60%-80%,企业迫切寻找降本方案。
编者按:泡沫还是新起点?
短短半年内从80亿到130亿美元的估值跳跃,让市场不禁质疑:Baseten是否被过度高估?从基本面看,其技术壁垒和客户粘性确实存在——许多头部AI公司已将其核心推理服务迁移至Baseten平台,一次性合同金额动辄上千万美元。但风险同样不容忽视:大客户因成本压力自研推理栈的可能性正在增加,Meta、微软等巨头已在内部建立推理优化团队;同时,开源替代方案(如Llama.cpp、ExLlamaV2)日益成熟,可能侵蚀商用服务市场。
另一个隐忧是GPU供应过剩。随着云厂商大量囤积H100/B200芯片,2027年很可能出现计算资源供大于求的局面,届时推理价格战将压缩利润率。Baseten的估值能否支撑其未来增长,取决于其能否在价格战前建立不可替代的生态系统,比如通过开发者社区和专用算子库形成锁定效应。
无论如何,Baseten这轮融资标志着AI推理赛道正式进入“十亿美元俱乐部”竞争时代。对于创业者而言,这既是机遇也是警示:资本可以快速催肥一家公司,但只有技术深度和商业验证才能让它走得更远。
本文编译自TechCrunch
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接