This article has not been translated into English yet. Showing the original Chinese version.

NVIDIA与谷歌合作降低AI推理成本

在Google Cloud Next大会上,谷歌与NVIDIA共同展示了其硬件路线图,旨在解决大规模AI推理的成本问题。两家公司详细介绍了新的A5X裸机实例,该实例运行在NVIDIA Vera Rubin NVL72机架级系统上。通过硬件和软件的协同设计,这一架构有望将AI推理成本降低至原来的十分之一。

在近日举行的Google Cloud Next大会上,谷歌与NVIDIA携手发布了一项重要合作计划,旨在通过先进的硬件和软件设计,大幅降低AI推理的成本。

合作背景

随着AI技术的不断发展,推理成本已成为影响企业应用AI技术的关键因素之一。推理成本主要涉及数据处理和模型运行所需的计算资源。为了应对这一挑战,谷歌与NVIDIA宣布共同开发新的硬件架构。

新硬件架构:A5X实例

此次发布的A5X裸机实例是这一合作的核心。该实例运行在NVIDIA Vera Rubin NVL72机架级系统上,采用最新的硬件和软件协同设计。通过这种设计,二者希望能够实现推理成本降低至当前的十分之一。

“通过我们的合作,我们希望为企业提供更具成本效益的AI解决方案。”——NVIDIA发言人

行业影响与前景

这种新的架构将对AI行业产生深远影响。首先,它将降低企业部署AI的门槛,使更多公司能够负担得起大规模AI应用。其次,通过降低推理成本,企业可以更频繁地使用AI进行实时数据分析和决策,提高业务效率。

编者按:AI推理成本的降低不仅是技术进步的体现,更是推动AI技术普及的重要因素。随着硬件和软件的不断创新,AI的应用场景将更加广泛。

本文编译自AI News