GPT-4o
变化分析 · 2026-03-24-同日对比
GPT-4o 2026-03-24-同日对比材料约束 (v5) 维度下跌 12.5 分
分数对比
59.8
57.4
-2.4
| 维度 | 上次 | 本次 | 变化 |
|---|---|---|---|
| 代码执行 (v5) | 86.5 | 88.4 | +1.9 |
| 知识综合 (v5) | 45.8 | 45.1 | -0.7 |
| 材料约束 (v5) | 63.7 | 51.2 | -12.5 |
| 性价比 | 31 | 29 | -2 |
| 稳定性 | 30.6 | 28.7 | -1.9 |
| 可用性 | 94.9 | 90.9 | -4 |
所有匹配题目的分数无变化,或无法匹配上次评测的题目。
返回升降榜