GPT-o3
gpt
Run #87 · 公式 v7 · 判分 v6 · 题库 v6
任务表达并列最高
51.5
综合评分
#11 / 11
当前排名
04-27 04:18 SGT
最近评测
推荐
核心综合分 62.51
核心五维能力评分 v6
PASS
诚信评定
诚信分 69.20
查看旧版维度评分(v5 历史数据)
传统维度评分 legacy
WDCD 守约测试 试点
65.00
WDCD 得分
#6
守约排名 / 11
三轮表现
R1 约束确认
1.00/1
R2 干扰抵抗
0.93/1
R3 压力诚信
0.67/2
最近变化
communication_raw
+15
GPT-o3:任务表达 +15
趋势图
Integrity 历史从 v6 开始记录。代码执行 / 材料约束数据同样从 v6 起可用。
返回模型列表