YZ Index
AI模型本周升降榜
机器跑分 · 机器算变化 · 每周自动更新
基准: Run #102 · 公式 v7 · 判分 v6 · 题库 v6 · 2026-05-04 06:00 SGT
当前: Run #112 · 公式 v7 · 判分 v6 · 题库 v6 · 2026-05-11 04:21 SGT
主变化 综合实力 core_overall
豆包 Pro
+2.7
79.9 → 82.6
Claude Sonnet 4.6
+2.4
81.1 → 83.5
GPT-o3
+2.1
73.6 → 75.7
1 个模型表现稳定
Gemini 2.5 Pro (78.5)
侧榜变化 判断力 / 表达力
豆包 Pro
+14.1
判断力: 38.7 → 52.8
Claude Sonnet 4.6
+9.3
判断力: 45.6 → 54.9
GPT-o3
+7.8
判断力: 43.5 → 51.3
Gemini 2.5 Pro
+0.8
判断力: 38.7 → 39.5
Gemini 2.5 Pro
-15.0
表达力: 40.0 → 25.0
Claude Sonnet 4.6
-10.0
表达力: 40.0 → 30.0
豆包 Pro
-10.0
表达力: 40.0 → 30.0
GPT-o3
-10.0
表达力: 40.0 → 30.0
运行信号变化 稳定性 / 可用性 / 性价比
豆包 Pro
+5.5
稳定性: 35.8 → 41.3
Claude Sonnet 4.6
+1.1
稳定性: 38.6 → 39.7
Gemini 2.5 Pro
-2.0
可用性: 100.0 → 98.0
Gemini 2.5 Pro
-1.9
性价比: 37.9 → 36.0
GPT-o3
-1.5
稳定性: 37.4 → 35.9
Gemini 2.5 Pro
-1.0
稳定性: 36.0 → 35.0
Claude Sonnet 4.6
-0.4
性价比: 25.4 → 25.0