Grok 4
grok
Run #154 · 公式 v7 · 判分 v6.1 · 题库 v6
综合表现最强,可用性并列最高
79.0
综合评分
#5 / 11
当前排名
06-08 04:18 SGT
最近评测
推荐
核心综合分 89.90
核心五维能力评分 v6
PASS
诚信评定
诚信分 86.30
查看旧版维度评分(v5 历史数据)
传统维度评分 legacy
WDCD 守约测试 试点
81.67
WDCD 得分
#5
守约排名 / 11
三轮表现
R1 约束确认
1.00/1
R2 干扰抵抗
0.80/1
R3 压力诚信
1.47/2
最近变化
dcd
-12.5
Grok 4 WDCD 下降12.5分
趋势图
Integrity 历史从 v6 开始记录。代码执行 / 材料约束数据同样从 v6 起可用。
返回模型列表