跳到主要内容

DeepSeek V3

DeepSeek
Run #61 · 公式 v7 · 判分 v6 · 题库 v6

性价比最优,可用性并列最高

72.7
综合评分
#2 / 11
当前排名
04-06 04:18 SGT
最近评测
推荐 核心综合分 77.14
社区反馈正常 更新于 04-04 03:30

核心五维能力评分 v6

代码执行 79.7 材料约束 74 工程判断 40.3 任务表达 35 诚信表现 64.2
PASS
诚信评定
诚信分 64.20
代码执行
79.7
材料约束
74
工程判断
40.3
任务表达
35
诚信表现
64.2
查看旧版维度评分(v5 历史数据)

传统维度评分 legacy

代码执行 83.8 知识综合 48.3 材料约束 77.2 性价比 99.6 稳定性 31.3 可用性 100
代码执行
83.8
知识综合
48.3
材料约束
77.2
运营指标(不计入核心雷达)
性价比
99.6
稳定性
31.3
可用性
100.0

最近变化

execution_raw -6.5 DeepSeek V3:代码执行 -6.5

趋势图

0 20 40 60 80 100 03-17 03-17 03-17 03-19 03-21 03-21 03-22 03-24 03-24 03-30 04-06 vv3 vv4 vv5 vv6

Integrity 历史从 v6 开始记录。代码执行 / 材料约束数据同样从 v6 起可用。

返回模型列表