MLPerf Tiny v1.3 技术详解

2026年02月10日 14 约3分钟 MLC

MLC MLPerf Tiny 边缘AI TinyML基准图像分类异常检测

MLPerf Tiny v1.3 概述

MLPerf Tiny v1.3 是MLCommons推出的最新边缘AI基准版本，专为资源受限设备设计，如微控制器（MCU）和低功耗边缘处理器。该基准旨在标准化TinyML模型评估，帮助开发者比较不同硬件和软件栈在准确率、延迟和功耗方面的性能。

相较前版，v1.3引入两大全新基准：Image Classification (IC) 和 Visual Wake Words (VWW)，并对现有Keyword Spotting (KWS) 和 Anomaly Detection (AD)进行了优化。这些更新反映了边缘AI在智能家居、穿戴设备和物联网中的实际需求。

新增基准详解

Image Classification (IC)

IC基准使用CIFAR-10数据集，模型基于MobileNetV2架构。任务要求在224x224分辨率图像上实现高准确率，同时控制推理延迟在30ms以内。评估指标包括Top-1准确率和每瓦特吞吐量，适用于视觉边缘应用。

数据集：CIFAR-10（60,000张32x32彩色图像）
模型：MobileNetV2（量化至INT8）
性能目标：准确率>70%，延迟<30ms

Visual Wake Words (VWW)

VWW模拟设备唤醒场景，使用自定义数据集包含10万张图像（有/无唤醒手势）。模型采用轻量CNN，目标检测唤醒词如手势。强调低功耗，适合始终在线设备。

数据集：VWW v1.0（平衡正负样本）
模型：EfficientNet-Lite（优化版）
指标：召回率>90%，功耗<1mJ/推理

优化基准更新

Keyword Spotting (KWS)

基于Google Speech Commands v2数据集，引入多关键词支持（如10类命令）。模型使用TC-ResNet，准确率目标提升至95%以上。

Anomaly Detection (AD)

针对工业传感器数据，使用NAB数据集。模型为Autoencoder变体，检测异常阈值F1分数>0.85。

评估规则与框架

所有基准采用闭合模型规则（Closed Division），支持自定义实现（Open Division）。推理框架包括TensorFlow Lite Micro、TVM和SGLang。提交需报告离线准确率、实时因子（RTF） 和硬件规格。首次提交截止日期为2025年Q1。

硬件范围：MCU（<1MB RAM）、边缘SoC
量化支持：INT8/FP16
功耗测量：标准电源追踪

意义与展望

MLPerf Tiny v1.3 推动TinyML生态成熟，预计首批结果将于2025年发布。开发者可通过MLCommons官网下载基准套件，开始优化部署。