GPT-o3
OpenAI
变化分析 · 2026 第15周
GPT-o3 2026 第15周稳定性 维度上涨 2.2 分
分数对比
55.0
52.9
-2.1
| 维度 | 上次 | 本次 | 变化 |
|---|---|---|---|
| 代码执行 (v5) | 84.7 | 80.3 | -4.4 |
| 知识综合 (v5) | 47.2 | 47.1 | -0.1 |
| 材料约束 (v5) | 56.9 | 53 | -3.9 |
| 性价比 | 7.7 | 7.2 | -0.5 |
| 稳定性 | 29 | 31.2 | +2.2 |
| 可用性 | 93.9 | 89 | -4.9 |
所有匹配题目的分数无变化,或无法匹配上次评测的题目。
返回升降榜