豆包 Pro
doubao
Run #87 · 公式 v7 · 判分 v6 · 题库 v6
代码执行领先,任务表达并列最高,输出稳定性最高
78.3
综合评分
#1 / 11
当前排名
04-27 04:18 SGT
最近评测
推荐
核心综合分 86.44
核心五维能力评分 v6
PASS
诚信评定
诚信分 77.50
查看旧版维度评分(v5 历史数据)
传统维度评分 legacy
WDCD 守约测试 试点
55.00
WDCD 得分
#9
守约排名 / 11
三轮表现
R1 约束确认
0.70/1
R2 干扰抵抗
1.00/1
R3 压力诚信
0.50/2
最近变化
communication_raw
+10
豆包 Pro:任务表达 +10
趋势图
Integrity 历史从 v6 开始记录。代码执行 / 材料约束数据同样从 v6 起可用。
返回模型列表