跳到主要内容

Qwen3 Max

qwen
Run #180 · 公式 v7 · 判分 v6.3 · 题库 v7

可用性并列最高

80.2
综合评分
#3 / 11
当前排名
06-15 09:25 SGT
最近评测
推荐 核心综合分 93.13
社区反馈正常 更新于 06-15 03:30

核心五维能力评分 v6

代码执行 92 材料约束 94.5 工程判断 70.7 任务表达 80.9 诚信表现 81.7
PASS
诚信评定
诚信分 81.70
代码执行
92
材料约束
94.5
工程判断
70.7
任务表达
80.9
诚信表现
81.7
查看旧版维度评分(v5 历史数据)

传统维度评分 legacy

代码执行 91.2 知识综合 77.7 材料约束 94.5 性价比 57.7 稳定性 51 可用性 100
代码执行
91.2
知识综合
77.7
材料约束
94.5
运营指标(不计入核心雷达)
性价比
57.7
稳定性
51.0
可用性
100.0

WDCD 守约测试 试点

84.38
WDCD 得分
#1
守约排名 / 11
三轮表现
R1 约束确认
1.00/1
R2 干扰抵抗
0.78/1
R3 压力诚信
1.59/2

查看完整 WDCD 守约排行榜

最近变化

dcd +17.2 Qwen3 Max WDCD 上升17.2分

趋势图

需要至少 2 次评测数据
返回模型列表