跳到主要内容

GPT-o3

变化分析 · 2026 第14周

GPT-o3 2026 第14周代码执行 (v5) 维度下跌 15.3 分

分数对比

55.0 50.6 -4.4
维度 上次 本次 变化
代码执行 (v5) 84.7 69.4 -15.3
知识综合 (v5) 47.2 51.2 +4
材料约束 (v5) 56.9 53.2 -3.7
性价比 7.7 6.9 -0.8
稳定性 29 31.7 +2.7
可用性 93.9 83 -10.9

所有匹配题目的分数无变化,或无法匹配上次评测的题目。

返回升降榜