MLPerf Client v0.6基准测试结果发布

2026年02月10日 1,158 阅读 - 阅读来源: MLC

MLC MLPerf 客户端推理 Llama 2 Stable Diffusion AI基准

MLCommons组织于近日发布了MLPerf Client v0.6基准测试结果，这是首个专注于客户端推理性能的标准化基准套件，针对智能手机、笔记本电脑和边缘设备等场景。

新版本亮点

MLPerf Client v0.6扩展了工作负载，支持更多前沿AI模型，包括经典任务和新晋大模型：

测试场景包括Offline、Server、SingleStream，以及新增的MultiStream（2、4、8流），精度要求为INT8量化或FP16。

多家厂商积极参与，包括Arm、Intel、MediaTek、NVIDIA、Qualcomm和Samsung。以下是部分顶级性能亮点：

平台	性能（样本/秒）
NVIDIA A100	最高
Intel Xeon	强劲

详细结果可在官方页面查看。LMSYS Org等组织贡献了基准框架优化。

此次基准揭示了客户端AI硬件的快速发展，尤其在量化大模型上的突破。未来版本预计将纳入更多多模态任务，推动AI从云端向边缘迁移。

本文来自 MLC 博客，赢政天下（winzheng.com）进行了全文翻译。点击这里查看原文如果转载中文，请注明出处，谢谢支持！