维度下跌
严重度 10/10
2026-W12
GPT-o3 稳定性下跌 25 分
分数对比
| 维度 | 上期 | 本期 | 变化 |
|---|---|---|---|
| 主榜 (v5) | 39.0 | 34.5 | -4.5 |
| 代码执行 (v5) | 20.2 | 43.4 | +23.2 |
| 知识综合 (v5) | 34.4 | 35.8 | +1.4 |
| 材料约束 (v5) | 62.3 | 28.8 | -33.5 |
| 性价比 | 4.7 | 4.3 | -0.4 |
| 稳定性 | 53.0 | 28.0 | -25 |
| 可用性 | 100.0 | 69.0 | -31 |
受影响维度
稳定性
Run #37 · 公式 v5 · 判分 v6 · 题库 v5.1 · 2026-03-22 14:26 SGT
查看 GPT-o3 完整档案