Grok 4
grok
Run #180 · 公式 v7 · 判分 v6.3 · 题库 v7
可用性并列最高
75.7
综合评分
#7 / 11
当前排名
06-15 09:25 SGT
最近评测
推荐
核心综合分 88.02
核心五维能力评分 v6
PASS
诚信评定
诚信分 83.30
查看旧版维度评分(v5 历史数据)
传统维度评分 legacy
WDCD 守约测试 试点
82.03
WDCD 得分
#2
守约排名 / 11
三轮表现
R1 约束确认
1.00/1
R2 干扰抵抗
0.84/1
R3 压力诚信
1.44/2
最近变化
dcd
+7.8
Grok 4 WDCD 上升7.8分
趋势图
需要至少 2 次评测数据
返回模型列表