GPT-4o
变化分析 · 2026 第14周
GPT-4o 2026 第14周代码执行 (v5) 维度下跌 23.7 分
分数对比
59.8
49.3
-10.5
| 维度 | 上次 | 本次 | 变化 |
|---|---|---|---|
| 代码执行 (v5) | 86.5 | 62.8 | -23.7 |
| 知识综合 (v5) | 45.8 | 47.2 | +1.4 |
| 材料约束 (v5) | 63.7 | 49.1 | -14.6 |
| 性价比 | 31 | 24.9 | -6.1 |
| 稳定性 | 30.6 | 27.8 | -2.8 |
| 可用性 | 94.9 | 79 | -15.9 |
所有匹配题目的分数无变化,或无法匹配上次评测的题目。
返回升降榜