跳到主要内容
维度下跌 严重度 10/10 2026-W12

GPT-o3 可用性下跌 31 分

GPT-o3 Run #37

分数对比

维度 上期 本期 变化
主榜 (v5) 39.0 34.5 -4.5
代码执行 (v5) 20.2 43.4 +23.2
知识综合 (v5) 34.4 35.8 +1.4
材料约束 (v5) 62.3 28.8 -33.5
性价比 4.7 4.3 -0.4
稳定性 53.0 28.0 -25
可用性 100.0 69.0 -31

受影响维度

可用性
Run #37 · 公式 v5 · 判分 v6 · 题库 v5.1 · 2026-03-22 14:26 SGT
查看 GPT-o3 完整档案