继英伟达200亿收购案后,AI芯片创企Groq再融6.5亿美元

据Axios报道,AI芯片初创公司Groq正在寻求通过内部融资募集6.5亿美元,标志着其从硬件制造向AI推理服务的战略转向。这一举措紧随英伟达斥资200亿美元进行“非雇佣式收购”之后,凸显了AI算力市场从训练到推理的焦点转移。Groq计划利用资金强化其推理平台,与英伟达、AMD等巨头展开错位竞争。

融资动向:6.5亿美元内部轮,战略重心转向推理

据Axios援引知情人士消息,AI芯片初创公司Groq正在寻求一笔高达6.5亿美元的内部融资轮。这笔资金将主要用于推动公司从硬件设计向AI推理服务的转型——也就是优化AI模型对用户提示请求的响应处理过程。Groq的创始团队此前曾透露,他们希望成为“AI推理的AWS”,即提供云端推理基础设施。

这轮融资发生在英伟达刚刚完成一项备受争议的“非雇佣式收购”之后——英伟达以约200亿美元收购了某家未具名的AI芯片设计团队,旨在获得其人才和技术。Groq此时宣布融资,既表明市场对推理赛道的看好,也反映出初创公司正在寻找差异化路径,避免与英伟达在训练芯片领域正面交锋。

Groq的独特架构:从硬件叛逆者到推理新贵

Groq成立于2016年,由前谷歌TPU核心团队成员创立。其芯片采用了一种极为激进的“张量流处理器”(TSP)架构,摒弃了传统的指令流水线,将所有计算任务硬编码为数据流图。这种设计在训练场景下因灵活性不足而受限,但在推理任务中却展现出惊人的低延迟和高吞吐量。

在2024年,Groq推出了其第二代芯片,并开始以“推理即服务”模式向开发者提供API。其产品在运行大型语言模型(如Llama 2、Gemma)时,推理速度比英伟达H100快数倍,且功耗更低。这一差异化优势吸引了包括Meta、谷歌在内的潜在客户进行试点。

曾经有人质疑:为什么不直接使用英伟达?答案是:当延迟从几毫秒降到微秒级,新的应用场景就会涌现,比如实时语音交互、自动驾驶的实时决策等。Groq赌的就是这个未来。——行业分析师评论

编者按:推理市场爆发的前夜

AI推理正在成为下一个兵家必争之地。随着大模型部署需求激增,推理成本占总计算成本的比重已从2023年的30%预计上升到2026年的70%以上。英伟达虽然凭借CUDA生态在训练芯片占据绝对优势,但其推理芯片在能效和性价比方面并非不可撼动。

Groq的这次融资表明,投资者愿意押注“第二曲线”。不过,Groq面临两大挑战:一是软件生态的缺失——其芯片无法直接运行PyTorch/TensorFlow代码,需要开发者额外适配;二是供应链风险——Groq依赖台积电先进制程,且尚未实现规模化量产。此外,AMD、Intel以及众多初创公司也在推理赛道积极布局。

Groq的未来之路:开放生态还是垂直整合?

Groq计划将新资金用于三方面:扩建自有推理数据中心、完善开发者工具链(包括推出适配主流框架的编译器)、以及开拓汽车和边缘计算领域。该公司CEO Jonathan Ross在近期的播客中表示:“我们不是在和英伟达竞争芯片,而是在重塑AI的交付方式。未来每个应用都将内嵌推理能力,就像今天的云服务一样无处不在。”

从更宏观的视角看,Groq的转型代表了AI芯片行业从“造更快的卡”到“提供更好的服务”的范式转变。英伟达的200亿美元收购案实际上也是对这一趋势的认可——通过买下团队来加速其推理芯片的研发。

截至发稿,Groq尚未对融资消息置评。若本轮融资完成,Groq的估值将突破70亿美元,成为AI推理领域估值最高的独立初创公司之一。这无疑会给整个算力市场带来新的变数。

本文编译自TechCrunch