MLCommons 发布 MLPerf Mobile v6.0,新增设备端 LLM 基准

This article has not been translated into English yet. Showing the original Chinese version.

MLCommons 今日宣布推出 MLPerf Mobile v6.0 版本,新增针对 Android 设备上运行大语言模型(LLMs)的生成式 AI 基准测试。这些测试与 MLPerf Mobile 应用中已有的图像生成、目标检测、超分辨率等基准共同构成完整测试套件。

新增设备端 LLM 基准测试

MLPerf Mobile v6.0 采用以下模型作为新的 LLM 基准:

  • Llama 3.2 1B Instruct
  • Llama 3.2 3B Instruct
  • Llama 3.1 8B Instruct

模型将处理来自 TinyMMLU 和 IFEval 数据集的请求,以量化设备端 AI 推理的性能和准确性。

LLM 测试可在内存充足的设备上通过 CPU 运行,无需定制加速。此外,本次发布支持在高通 Snapdragon 8 Elite Gen 5 SoC 上通过 NPU 加速执行 Llama 3.1 8B Instruct 模型。工作组计划未来扩展对更多设备和平台的 LLM 加速支持。

扩展 SoC 支持与广泛可用性

为快速集成新设备支持,v6.0 版本新增对基于联发科 Dimensity 9500 系列芯片的设备支持。同时更新了对以下芯片的支持:

  • Qualcomm Snapdragon 8 Elite Gen 5
  • Samsung Exynos 2600

应用已支持众多移动设备上的 NPU 加速执行。

MLPerf Mobile 应用可通过 Google Play 商店、Apple App Store 以及 MLPerf Mobile GitHub 仓库获取。GitHub 仓库还提供了基于 Apache 2.0 许可的完整开源代码。

This article is from MLC blog, translated in full by Winzheng (winzheng.com). Click here to view the original When republishing the translation, please credit the source. Thank you!