DeepSeek R1
DeepSeek
Run #87 · 公式 v7 · 判分 v6 · 题库 v6
任务表达并列最高,可用性并列最高
70.0
综合评分
#4 / 11
当前排名
04-27 04:18 SGT
最近评测
中性
核心综合分 75.89
核心五维能力评分 v6
WARN
诚信评定
诚信分 54.20
查看旧版维度评分(v5 历史数据)
传统维度评分 legacy
最近变化
communication_raw
+10
DeepSeek R1:任务表达 +10
趋势图
Integrity 历史从 v6 开始记录。代码执行 / 材料约束数据同样从 v6 起可用。
返回模型列表