2025 MLC 新星榜单揭晓

2026年02月10日 937 阅读 - 阅读来源: MLC

MLCommons MLPerf MLC AI基准 Rising Stars

2025 MLC 新星榜单发布

MLCommons 组织近日公布了 2025 MLC Rising Stars 榜单，这是对 MLPerf Inference v5.0 基准测试中首次提交结果的特别表彰。这些系统采用 MLC（ML Compiler）框架，在各种 AI 推理任务中脱颖而出，展示了新兴硬件和软件优化的潜力。

榜单亮点

NVIDIA H200 在 LLM 推理任务（如 Llama 3.1 405B）上，以 SGLang 运行时实现最高吞吐量，服务器端离线场景下达 1500+ tokens/s。
AMD MI300X 在图像生成任务（Stable Diffusion XL）中表现出色，首次提交即进入新星行列。
其他新星包括基于 Intel Gaudi3 和自定义加速器的系统，在边缘和服务器场景下优化了延迟和能效。

这些结果基于标准 MLPerf 基准套件，包括 GPTJ、BERT 等经典模型，以及新兴的扩散模型和多模态任务。

MLC 框架的作用

MLC 作为开源编译器，支持 TVM 后端，能将模型编译为高效的机器代码，适用于 WebGPU、CUDA 等多种后端。此次榜单凸显其在生产部署中的优势，尤其在量化模型（如 INT4/INT8）上的加速效果高达 2-3 倍。

对 AI 行业的意义

Rising Stars 榜单鼓励更多厂商参与开源基准，推动硬件多样性和软件生态发展。LMSYS Org 等组织也表示，将继续跟踪这些系统在真实 Chatbot Arena 等场景下的表现。完整结果详见官方链接。

本文来自 MLC 博客，赢政天下（winzheng.com）进行了全文翻译。点击这里查看原文如果转载中文，请注明出处，谢谢支持！