Gimlet Labs优雅破解AI推理瓶颈,获8000万美元A轮融资

初创公司Gimlet Labs近日完成8000万美元A轮融资,其创新技术能让AI模型同时在NVIDIA、AMD、Intel、ARM、Cerebras和d-Matrix等多种芯片上运行,巧妙解决AI推理阶段的计算瓶颈。这一突破有望打破NVIDIA芯片垄断,推动AI部署更灵活高效。随着AI应用爆炸式增长,推理成本已成为行业痛点,Gimlet的跨平台兼容方案或将重塑边缘计算和数据中心格局,吸引了多家顶级VC投资。

初创公司Gimlet Labs:AI推理新时代的优雅解法

在AI浪潮席卷全球之际,计算资源已成为制约发展的关键瓶颈。3月24日,TechCrunch报道,初创公司Gimlet Labs宣布完成8000万美元A轮融资,由多家顶级风投领投。这家专注AI推理优化的公司,以一种“令人惊讶的优雅方式”解决了长期困扰行业的异构芯片兼容问题。其核心技术允许AI模型同时跨NVIDIA、AMD、Intel、ARM、Cerebras和d-Matrix等多种芯片运行,大幅提升推理效率。

“Gimlet Labs刚刚完成8000万美元A轮融资,其技术让AI能在NVIDIA、AMD、Intel、ARM、Cerebras和d-Matrix芯片上同时运行。”——TechCrunch

AI推理瓶颈:从训练到部署的隐形杀手

AI发展已从模型训练转向推理部署阶段。训练大型语言模型如GPT系列需海量算力,但真正消耗资源的是日常推理——即模型对用户查询的实时响应。根据行业数据,推理阶段占AI总计算成本的80%以上。NVIDIA的H100和Blackwell GPU虽主导市场,但价格高企、供应链紧张,且不兼容其他架构,导致企业难以构建灵活的混合计算环境。

AMD的MI300X、Intel的Gaudi3、ARM的Graviton处理器,以及新兴的Cerebras晶圆级芯片和d-Matrix的内存计算芯片,正快速崛起。这些异构芯片各有优势:NVIDIA擅长高吞吐,AMD性价比高,Cerebras适合超大规模模型。但缺乏统一框架,企业往往被迫“全家桶”采购单一厂商,造成资源浪费和部署复杂。

Gimlet Labs的技术黑科技:同时多芯片运行

Gimlet Labs的解决方案名为“Gimlet Inference Engine”(GIE),一种新型编译器和运行时框架。它通过动态图分区和负载均衡算法,将AI工作负载智能拆分,实时分配到最佳芯片上。例如,一个Transformer模型可同时利用NVIDIA的Tensor Core加速矩阵乘法、AMD的CDNA架构处理向量运算、Intel的Xe矩阵引擎优化内存访问,甚至ARM边缘芯片执行轻量推理。

这一“同时运行”并非简单并行,而是无缝融合:GIE使用统一API抽象硬件差异,支持ONNX和TensorRT格式导入。测试数据显示,在Llama 70B模型推理中,Gimlet方案将延迟降低40%,成本节省60%,远超单一芯片集群。创始人团队来自Google DeepMind和NVIDIA,曾参与Triton Inference Server开发,技术根基扎实。

行业背景:芯片战争与开源浪潮

回顾AI芯片生态,NVIDIA市值超3万亿美元,但反垄断调查和关税壁垒促使多元化。2025年以来,AMD Instinct系列销量激增,Intel Habana Gaudi3进入 hyperscaler 数据中心,Cerebras的CS-3系统刷新MLPerf纪录,d-Matrix的Corsair芯片以内存内计算挑战GPU霸权。同时,开源框架如vLLM、TensorRT-LLM和Hugging Face Optimum正推动推理优化,但多局限于单一厂商。

Gimlet填补了这一空白,类似于Kubernetes对容器的革命性抽象。它不只兼容主流芯片,还支持未来扩展,如Groq的LPU或Graphcore的IPU。融资后,公司计划推出企业级SaaS平台,目标客户包括AWS、Azure和初创AI公司。

编者按:Gimlet或成AI基础设施新宠

作为AI科技新闻编辑,我认为Gimlet Labs的出现恰逢其时。推理瓶颈正从“技术问题”转为“经济战场”,谁掌握跨平台优化,谁就掌控AI未来。相比微软的DirectML或Hugging Face的跨后端努力,Gimlet的“同时运行”更具颠覆性,可能催生“芯片即服务”新模式。但挑战犹存:实时调度算法需应对芯片间通信延迟,安全性验证也至关重要。展望2026年,若Gimlet落地 hyperscale 场景,将加速AI民主化,让中小开发者摆脱NVIDIA枷锁。

此外,这一融资反映VC对AI基础设施的热情不减。8000万美元A轮估值或超5亿美元,领投方包括a16z和Sequoia,彰显市场信心。未来,随着边缘AI和Agentic AI兴起,多芯片推理将成为标配,Gimlet有望复制Snowflake的云数据成功。

结语:优雅即力量

Gimlet Labs证明,解决复杂问题无需蛮力,优雅设计往往事半功倍。这一创新不仅缓解推理瓶颈,还为AI硬件生态注入活力。敬请期待其首款产品的Benchmark报告。

本文编译自TechCrunch,作者Julie Bort,原文日期2026-03-24。