黄仁勋:英伟达发现全新2000亿美元AI代理CPU市场

英伟达CEO黄仁勋近日透露,公司发现一个“全新”的价值2000亿美元的市场——专为AI代理设计的CPU。他强调,随着自主智能体的普及,对高效能、低功耗CPU的需求将迎来爆发式增长,英伟达已提前布局,将整合Grace CPU与GPU优势,重塑AI基础设施格局。

英伟达(Nvidia)CEO黄仁勋(Jensen Huang)在近日的一次投资者电话会议上抛出了一颗重磅炸弹:他发现了一个“全新”的、价值2000亿美元的市场——为AI代理(AI Agents)设计的专用CPU。

这位在GPU领域几乎封神的掌舵人表示,虽然英伟达以图形处理器闻名,但AI代理的兴起正在催生一种截然不同的计算需求。这些自主运行、能够规划、推理和使用工具的智能体,需要高频、低延迟的CPU来执行逻辑决策和协调任务,而不是单纯依赖于GPU的大规模并行计算。

“我们看到了一个完全未开发的蓝海。传统CPU无法满足AI代理对实时响应和复杂指令流的需求,而我们的Grace CPU正是为此优化设计的。”黄仁勋在演讲中这样断言。

从GPU到CPU:英伟达的“新大陆”

黄仁勋预测,到2030年,全球AI代理的数量将达到数百亿,每个代理背后都需要一颗高效能的CPU来驱动。他估算,仅这一细分市场就将为英伟达带来约2000亿美元的营收机会,相当于现有数据中心GPU市场的两倍。值得注意的是,这与英伟达近年对Arm架构CPU的持续投入一脉相承。其Grace CPU核心基于Arm Neoverse V2设计,能效比是传统x86 CPU的2.5倍,特别适合大规模部署的AI代理场景。

这一观点在行业内部引起巨大争论。分析师指出,传统CPU巨头英特尔和AMD早已在服务器市场深耕多年,英伟达虽在AI加速器领域领先,但CPU生态布局尚显薄弱。然而,黄仁勋认为,AI代理要求CPU与GPU之间实现“纳秒级”协同,只有通过统一的NVLink-C2C互连技术,才能打破传统PCIe的瓶颈。英伟达的Grace Hopper超级芯片已经验证了这种异构架构的效率。

什么是AI代理?为什么需要专用CPU?

AI代理并非简单的聊天机器人,而是能够自主执行多步骤任务、访问外部API、记忆上下文并动态调整策略的智能体系统。例如,一个企业AI代理可能需要同时调用CRM、ERP、邮件系统,并在不同窗口间切换逻辑。这种工作负载对CPU的单线程性能、指令集丰富度和缓存一致性提出了极高要求。当前市场主流的CPU(无论是x86还是Arm通用核心)在设计时并未考虑这种混合推理场景,通常只能以“硬切换”方式中断GPU任务,导致效率低下。

英伟达的解决方案是通过Grace CPU内置的专用加速引擎(如光流加速器和可编程控制单元)来解耦推理与执行,使AI代理的决策循环可以零延迟地在CPU上完成,而GPU则专注于高吞吐量的模型推理。黄仁勋形象地比喻道:“GPU是肌肉,CPU是大脑。AI代理不仅需要肌肉,更需要一个聪明且快速的大脑。”

编者按:英伟达的“芯片帝国”野心

表面上看,这一预测充满乐观色彩,但深究之下,这更像是一场精心布局的战略转移。英伟达在数据中心GPU市场的份额已超过80%,增长天花板隐约可见。通过将AI代理CPU塑造成下一个风口,英伟达不仅拓展了营收空间,更将竞争对手(尤其是英特尔和AMD)拖入其擅长的异构计算战场——因为只有英伟达能同时提供GPU、CPU以及无缝的互联技术。

不过,质疑声同样存在。2000亿美元的市场规模是否过于宏大?黄仁勋给出的数字中包含了对AI代理普及速度的极端假设。但不可否认,大型云服务商如微软、亚马逊和谷歌已经在加大对AI代理的投入,而这些云厂商同样在自研CPU(基于Arm架构)。英伟达需要证明其专有CPU在性价比和生态兼容性上优于通用方案。

无论如何,黄仁勋的言论已经为行业投下了一颗震撼弹。如果这一预测成真,那么英伟达将不再是“GPU公司”,而是能够定义下一代AI基础设施的“全栈计算平台”。

本文编译自TechCrunch