NVIDIA副总裁称AI算力成本远超员工薪资 双方激辩经济性

NVIDIA副总裁Bryan Catanzaro表示,其团队AI算力成本已超过员工薪资。该言论在X平台引发对立讨论,正方认可AI价值但指出基础设施压力,反方质疑AI投入产出比。文章基于公开事实,分析算力成本构成、行业影响及优化方向,区分已确认信息与各方观点。

NVIDIA副总裁Bryan Catanzaro近日表示,其团队AI算力成本已远超员工薪资。这条信息经多家来源核实。

算力成本为何超过人力

AI系统运行依赖大量GPU集群。以当前主流训练流程为例,一个千亿参数模型单次训练需数千块高性能GPU持续数周。电费、机房冷却和硬件折旧构成主要开支。Catanzaro的表述指向日常推理和迭代阶段的累计消耗,而非单次实验。

员工薪资属于固定成本,而算力需求随模型规模和用户量线性上升。2026年5月数据仍显示,单卡日均电费加折旧已接近部分地区工程师月薪水平。规模化部署后,总量差距进一步拉大。

技术层面的成本构成

算力开支可分解为三部分:硬件采购、电力与散热、软件调度效率。硬件每18个月迭代一次,旧卡利用率下降导致隐性浪费。电力成本受数据中心选址影响,液冷方案虽能降低PUE,但前期改造费用高昂。调度算法若无法充分利用GPU,空闲率直接放大单次任务成本。

  • 硬件折旧:主流训练卡使用寿命约3年
  • 电力占比:部分集群已超总成本40%
  • 利用率:未优化集群常见空闲率达30%以上

对行业的影响

成本结构变化迫使企业重新评估AI项目优先级。初创公司更倾向调用外部API而非自建集群,以避免固定资产投入。大型科技公司则加速内部芯片和液冷技术研发,目标是将每token推理成本降低一个数量级。

2026年,部分云服务商已调整定价策略,对长时间占用的GPU实例收取更高费用。此举直接反映底层算力稀缺。

未来优化路径

降低算力成本的主要方向包括模型压缩、稀疏计算和新架构。模型蒸馏可在精度损失可控范围内减少参数量。稀疏注意力机制仅激活必要计算单元。新型芯片针对特定算子优化,理论峰值利用率高于通用GPU。