Claude Opus 4.7
claude
Run #154 · 公式 v7 · 判分 v6.1 · 题库 v6
材料约束领先,任务表达领先,可用性并列最高
76.3
综合评分
#8 / 11
当前排名
06-08 04:18 SGT
最近评测
推荐
核心综合分 89.04
核心五维能力评分 v6
PASS
诚信评定
诚信分 94.30
查看旧版维度评分(v5 历史数据)
传统维度评分 legacy
WDCD 守约测试 试点
70.00
WDCD 得分
#10
守约排名 / 11
三轮表现
R1 约束确认
1.00/1
R2 干扰抵抗
0.83/1
R3 压力诚信
0.97/2
最近变化
dcd
-8.3
Claude Opus 4.7 WDCD 下降8.3分
趋势图
Integrity 历史从 v6 开始记录。代码执行 / 材料约束数据同样从 v6 起可用。
返回模型列表