2025 MLC 新星榜单揭晓

2025 MLC 新星榜单发布

MLCommons 组织近日公布了 2025 MLC Rising Stars 榜单,这是对 MLPerf Inference v5.0 基准测试中首次提交结果的特别表彰。这些系统采用 MLC(ML Compiler)框架,在各种 AI 推理任务中脱颖而出,展示了新兴硬件和软件优化的潜力。

榜单亮点

  • NVIDIA H200 在 LLM 推理任务(如 Llama 3.1 405B)上,以 SGLang 运行时实现最高吞吐量,服务器端离线场景下达 1500+ tokens/s。
  • AMD MI300X 在图像生成任务(Stable Diffusion XL)中表现出色,首次提交即进入新星行列。
  • 其他新星包括基于 Intel Gaudi3 和自定义加速器的系统,在边缘和服务器场景下优化了延迟和能效。

这些结果基于标准 MLPerf 基准套件,包括 GPTJ、BERT 等经典模型,以及新兴的扩散模型和多模态任务。

MLC 框架的作用

MLC 作为开源编译器,支持 TVM 后端,能将模型编译为高效的机器代码,适用于 WebGPU、CUDA 等多种后端。此次榜单凸显其在生产部署中的优势,尤其在量化模型(如 INT4/INT8)上的加速效果高达 2-3 倍。

对 AI 行业的意义

Rising Stars 榜单鼓励更多厂商参与开源基准,推动硬件多样性和软件生态发展。LMSYS Org 等组织也表示,将继续跟踪这些系统在真实 Chatbot Arena 等场景下的表现。完整结果详见 官方链接

本文来自 MLC 博客,赢政天下(winzheng.com)进行了全文翻译。 点击这里查看原文 如果转载中文,请注明出处,谢谢支持!