跳到主要内容

Claude Opus 4.6

Anthropic
Run #61 · 公式 v7 · 判分 v6 · 题库 v6

工程判断并列最高,可用性并列最高

59.0
综合评分
#9 / 11
当前排名
04-06 04:18 SGT
最近评测
推荐 核心综合分 74.35
社区反馈正常 更新于 04-04 03:30

核心五维能力评分 v6

代码执行 77.9 材料约束 70 工程判断 48.8 任务表达 35 诚信表现 72.5
PASS
诚信评定
诚信分 72.50
代码执行
77.9
材料约束
70
工程判断
48.8
任务表达
35
诚信表现
72.5
查看旧版维度评分(v5 历史数据)

传统维度评分 legacy

代码执行 82 知识综合 53.6 材料约束 72.8 性价比 4.6 稳定性 34.8 可用性 100
代码执行
82.0
知识综合
53.6
材料约束
72.8
运营指标(不计入核心雷达)
性价比
4.6
稳定性
34.8
可用性
100.0

最近变化

execution_raw -11.3 Claude Opus 4.6:代码执行 -11.3

趋势图

0 20 40 60 80 100 03-17 03-17 03-17 03-19 03-21 03-21 03-22 03-24 03-24 03-30 04-06 vv3 vv4 vv5 vv6

Integrity 历史从 v6 开始记录。代码执行 / 材料约束数据同样从 v6 起可用。

返回模型列表