AI推理创企Baseten再融15亿美元,估值飙至130亿

AI推理创企Baseten再融15亿美元,估值飙至130亿
据TechCrunch报道,AI推理初创公司Baseten在上一轮巨额融资仅数月后,正接近完成新一轮15亿美元融资,估值达130亿美元。这轮融资正值“推理黄金热潮”持续升温,投资者争相押注能够高效运行AI模型的底层基础设施。Baseten专注于优化大语言模型推理性能,其客户包括多家头部AI应用企业。分析认为,推理层正成为AI产业链新增长极,但高估值也引发市场对泡沫风险的讨论。

据TechCrunch独家报道,知情人士透露,AI推理初创公司Baseten正接近完成一笔高达15亿美元的融资轮,公司估值随之攀升至130亿美元。值得注意的是,距离其上一轮大型融资仅过去数月——2025年底Baseten曾完成9亿美元融资,估值约80亿美元。短短半年内估值暴涨超60%,折射出资本市场对AI推理赛道的疯狂追捧。

推理黄金热:AI下半场的核心战场

Baseten成立于2021年,总部位于旧金山,核心业务是为大语言模型提供高效的推理(Inference)基础设施。在AI产业链中,训练阶段已涌现出OpenAI、Anthropic等巨头,而推理阶段作为模型实际落地应用的“最后一公里”,正成为下一个兵家必争之地。随着GPT-4o、Claude 3.5等模型参数规模持续膨胀,企业对低延迟、高吞吐的推理需求呈指数级增长。Baseten通过自研的推理引擎和GPU集群调度技术,帮助客户将推理成本降低40%以上,同时保证响应速度。

“推理基础设施是AI从玩具变成工具的桥梁。没有它,再强大的模型也只是实验室里的展品。” —— Baseten创始人兼CEO Tuhin Srivastava 此前在采访中表示。

本轮融资由多家顶级风投联合注资,包括原有投资者Lightspeed Venture Partners、Sequoia Capital,以及新进投资者Fidelity、T. Rowe Price等。值得注意的是,估值抬升的同时,Baseten并未披露盈利能力,其营收规模尚未公开,但据第三方估算,公司年度经常性收入(ARR)可能已突破3亿美元,主要来自按需付费和预留实例两种商业模式。

行业竞速:谁在争夺推理蛋糕?

Baseten并非孤军奋战。Together AI、Fireworks AI、Replicate等同类公司同样在加速融资。2026年5月,Together AI完成7亿美元融资,估值90亿美元;Fireworks AI也于近期斩获5亿美元。这些公司的共同点在于:提供比主流云厂商(AWS、Azure、GCP)更廉价、更灵活的推理服务,并且对VLLM、TensorRT等开源框架有深度优化。此外,英伟达也在通过NeMo和TensorRT-LLM等工具切入推理优化市场,但其云端服务并不直接与初创公司竞争。

从融资节奏看,2026上半年全球AI推理基础设施赛道累计融资已超400亿美元,超过2025年全年总额。这源于两个驱动力:一是多模态模型和Agent应用的爆发,推理调用量呈10倍级增长;二是推理成本仍占AI应用总成本的60%-80%,企业迫切寻找降本方案。

编者按:泡沫还是新起点?

短短半年内从80亿到130亿美元的估值跳跃,让市场不禁质疑:Baseten是否被过度高估?从基本面看,其技术壁垒和客户粘性确实存在——许多头部AI公司已将其核心推理服务迁移至Baseten平台,一次性合同金额动辄上千万美元。但风险同样不容忽视:大客户因成本压力自研推理栈的可能性正在增加,Meta、微软等巨头已在内部建立推理优化团队;同时,开源替代方案(如Llama.cpp、ExLlamaV2)日益成熟,可能侵蚀商用服务市场。

另一个隐忧是GPU供应过剩。随着云厂商大量囤积H100/B200芯片,2027年很可能出现计算资源供大于求的局面,届时推理价格战将压缩利润率。Baseten的估值能否支撑其未来增长,取决于其能否在价格战前建立不可替代的生态系统,比如通过开发者社区和专用算子库形成锁定效应。

无论如何,Baseten这轮融资标志着AI推理赛道正式进入“十亿美元俱乐部”竞争时代。对于创业者而言,这既是机遇也是警示:资本可以快速催肥一家公司,但只有技术深度和商业验证才能让它走得更远。

本文编译自TechCrunch