跳到主要内容
YZ Index

AI模型本周升降榜

机器跑分 · 机器算变化 · 每周自动更新

基准: Run #102 · 公式 v7 · 判分 v6 · 题库 v6 · 2026-05-04 06:00 SGT 当前: Run #112 · 公式 v7 · 判分 v6 · 题库 v6 · 2026-05-11 04:21 SGT

主变化 综合实力 core_overall

豆包 Pro +2.7
79.9 → 82.6
Claude Sonnet 4.6 +2.4
81.1 → 83.5
GPT-o3 +2.1
73.6 → 75.7
1 个模型表现稳定
Gemini 2.5 Pro (78.5)

侧榜变化 判断力 / 表达力

豆包 Pro +14.1
判断力: 38.7 → 52.8
Claude Sonnet 4.6 +9.3
判断力: 45.6 → 54.9
GPT-o3 +7.8
判断力: 43.5 → 51.3
Gemini 2.5 Pro +0.8
判断力: 38.7 → 39.5
Gemini 2.5 Pro -15.0
表达力: 40.0 → 25.0
Claude Sonnet 4.6 -10.0
表达力: 40.0 → 30.0
豆包 Pro -10.0
表达力: 40.0 → 30.0
GPT-o3 -10.0
表达力: 40.0 → 30.0

运行信号变化 稳定性 / 可用性 / 性价比

豆包 Pro +5.5
稳定性: 35.8 → 41.3
Claude Sonnet 4.6 +1.1
稳定性: 38.6 → 39.7
Gemini 2.5 Pro -2.0
可用性: 100.0 → 98.0
Gemini 2.5 Pro -1.9
性价比: 37.9 → 36.0
GPT-o3 -1.5
稳定性: 37.4 → 35.9
Gemini 2.5 Pro -1.0
稳定性: 36.0 → 35.0
Claude Sonnet 4.6 -0.4
性价比: 25.4 → 25.0

查看旧版维度变化(v5 向后兼容数据)
11 上升
0 下降
0 稳定
11 模型

本周上升