MLPerf Mobile Android v4.0 基准测试结果重磅发布

MLCommons 发布了 MLPerf Mobile v4.0 Android 版基准测试结果,这是移动 AI 性能评估的最新标准。此次测试涵盖图像分类、目标检测、超分辨率、语音识别、3D-UNet、BERT Squad 和 Stable Diffusion 等七大任务,涉及 Qualcomm、Samsung、MediaTek 等多家厂商的顶级 Android 设备。结果显示,Qualcomm Snapdragon 8 Gen 3 在多项任务中领跑,Samsung Galaxy S24 Ultra 等旗舰机型表现出色。新版基准引入更真实的场景模拟,推动移动 AI 硬件优化。开发者可通过这些数据评估设备性能,助力边缘 AI 应用落地。(128字)

MLCommons 组织近日公布了 MLPerf Mobile v4.0 for Android 的最新基准测试结果,这是移动设备 AI 性能评估领域的里程碑式更新。该基准聚焦 Android 平台,模拟真实用户场景,帮助厂商优化硬件并加速 AI 应用部署。

基准测试概述

MLPerf Mobile v4.0 Android 版引入了七项核心任务,覆盖计算机视觉、自然语言处理和生成式 AI 等关键领域:

  • Image Classification (ResNet50):图像分类,使用 ImageNet 数据集。
  • Object Detection (SSD-MobileNet):目标检测,基于 COCO 数据集。
  • Super Resolution (EDSR):图像超分辨率,提升低分辨率图片质量。
  • Speech Recognition (RNN-T):语音识别,支持实时转录。
  • 3D-UNet:医疗图像分割任务。
  • BERT Squad:问答任务,评估 NLP 能力。
  • Stable Diffusion:首次引入文本到图像生成,测试生成式 AI 性能。

测试强调低功耗和高吞吐量,适用于智能手机和平板等设备。

顶级性能表现

本次提交来自 Qualcomm、Samsung、MediaTek 和 Google 等厂商。以下是部分亮点结果(以 Offline 场景为例,单位:Samples/second):

  • Qualcomm Snapdragon 8 Gen 3 在 ResNet50 上达到 1,200+ 的峰值吞吐量,多项任务夺冠。
  • Samsung Galaxy S24 Ultra(搭载 Snapdragon 8 Gen 3)在 Stable Diffusion 任务中表现出色,生成速度领先。
  • MediaTek Dimensity 9300+ 在语音识别任务中紧追其后。
  • Google Tensor G3 在 BERT Squad 上展现强劲 NLP 能力。

完整结果表格可在 官方页面 查看,支持 SingleStream、Server 和 Offline 三种场景。

意义与展望

此次更新优化了基准框架,支持更多 NPU 和 GPU 加速器,推动 Android 生态 AI 标准化。Stable Diffusion 的加入标志着生成式 AI 向移动端渗透。随着结果公开,开发者能更好地选择硬件,预计将加速 on-device AI 创新,如实时图像生成和智能助手。

MLPerf Mobile 继续引领行业,推动高效、可持续的移动 AI 发展。