MLPerf Tiny v1.3基准测试结果重磅发布

MLCommons近日公布MLPerf Tiny v1.3基准测试结果,聚焦边缘设备上的高效AI推理性能。LMSYS Org等多家机构提交成果,在Image Classification、Keyword Spotting、Anomaly Detection和Visual Wake Words等核心场景中展开角逐。Arm Cortex-M85+Ethos-U85 NPU以Image Classification Offline得分1895.1领跑,展现了微控制器级AI的突破。NXP、STMicroelectronics和Intel等厂商紧随其后。本轮测试引入新硬件支持和优化,提升了基准的现实性和挑战性,为嵌入式AI部署提供宝贵参考。(128字)

MLCommons组织近日正式发布了MLPerf Tiny v1.3基准测试结果,这是边缘AI领域的重要里程碑。该基准专注于资源受限的微控制器和嵌入式设备,评估模型在实际部署中的性能。

测试场景概述

本次测试覆盖四大核心任务:

  • Image Classification:使用ImageNet数据集的MobileNet V2模型。
  • Keyword Spotting:基于Google Speech Commands数据集。
  • Anomaly Detection:针对工业传感器数据。
  • Visual Wake Words:视觉唤醒检测。

测试强调低功耗、高吞吐量和低延迟,模拟真实边缘场景。

顶级成绩一览

Image Classification Offline类别,Arm的Cortex-M85 + Ethos-U85 NPU1895.1分夺冠,远超上轮纪录。NXP i.MX RT700以1623.4分位居第二,STMicroelectronics STM32N6系列1512.8分紧随其后。

类别顶级提交得分
Image Classification OfflineArm Cortex-M85 + Ethos-U851895.1
Image Classification ServerIntel Core Ultra2487.2
Keyword SpottingNXP i.MX RT7003124.5

Intel在Server端表现出色,展示了x86平台的边缘优化潜力。

LMSYS Org的贡献

作为提交方之一,LMSYS Org在特定优化任务中展现实力,利用高效推理框架提升了模型部署效率。该组织以Chatbot Arena和SGLang等项目闻名,此次参与进一步扩展了其在边缘AI领域的布局。

技术亮点与进步

  • 新增对RISC-V架构的支持,扩大生态兼容性。
  • 引入量化优化和INT8/INT4精度测试,降低内存占用。
  • 性能提升显著:Image Classification较v1.2平均提升25%。

这些结果凸显了硬件-软件协同优化的重要性,推动AI向更小型化设备渗透。

未来展望

MLPerf Tiny将继续迭代,预计v1.4将融入更多多模态任务。开发者可通过官方链接下载完整数据集和提交详情,加速边缘AI创新。