GPT-o3
变化分析 · 2026 第14周
GPT-o3 2026 第14周代码执行 (v5) 维度下跌 15.3 分
分数对比
55.0
50.6
-4.4
| 维度 | 上次 | 本次 | 变化 |
|---|---|---|---|
| 代码执行 (v5) | 84.7 | 69.4 | -15.3 |
| 知识综合 (v5) | 47.2 | 51.2 | +4 |
| 材料约束 (v5) | 56.9 | 53.2 | -3.7 |
| 性价比 | 7.7 | 6.9 | -0.8 |
| 稳定性 | 29 | 31.7 | +2.7 |
| 可用性 | 93.9 | 83 | -10.9 |
所有匹配题目的分数无变化,或无法匹配上次评测的题目。
返回升降榜