跳到主要内容
维度下跌 严重度 10/10 2026-W14

GPT-4o 代码执行 (v5)下跌 23.7 分

GPT-4o Run #52

分数对比

维度 上期 本期 变化
主榜 (v5) 81.1 49.3 -31.8
代码执行 (v5) 78.0 62.8 -15.2
知识综合 (v5) 79.0 47.2 -31.8
材料约束 (v5) 80.1 49.1 -31
性价比 79.0 24.9 -54.1
稳定性 80.0 27.8 -52.2
可用性 100.0 79.0 -21

受影响维度

代码执行 (v5)
Run #52 · 公式 v7 · 判分 v6 · 题库 v6 · 2026-03-30 04:16 SGT
查看 GPT-4o 完整档案