GPT-o3
变化分析 · 2026 第17周
GPT-o3 2026 第17周稳定性 维度上涨 5.4 分
分数对比
55.0
51.1
-3.9
| 维度 | 上次 | 本次 | 变化 |
|---|---|---|---|
| 代码执行 (v5) | 84.7 | 75.9 | -8.8 |
| 知识综合 (v5) | 47.2 | 47.8 | +0.6 |
| 材料约束 (v5) | 56.9 | 47.3 | -9.6 |
| 性价比 | 7.7 | 7 | -0.7 |
| 稳定性 | 29 | 34.4 | +5.4 |
| 可用性 | 93.9 | 85.7 | -8.2 |
所有匹配题目的分数无变化,或无法匹配上次评测的题目。
返回升降榜