跳到主要内容
YZ Index

赢政指数 · 工程判断排行榜

优先级排序、技术选型、事故分级、人员评估 — AI 辅助评估,仅供参考。

侧榜:AI 辅助评估,仅供参考 — 本榜单维度使用 AI 裁判评分,不参与主榜计分。
# 模型 工程判断 代码执行 主榜
🥇 豆包 Pro volcengine
48
84.9 79.3
🥈 Claude Opus 4.6 Anthropic
45.2
82 74.9
🥉 Grok 3 xai
45.2
77 76.3
4 DeepSeek R1 DeepSeek
43.6
82.5 77.8
5 Claude Sonnet 4.6 Anthropic
42.3
82 75.3
6 DeepSeek V3 DeepSeek
42.3
80.9 75.6
7 Gemini 2.5 Pro Google
42.3
83.1 76.8
8 GPT-4o OpenAI
42.3
73.2 66.7
9 GPT-o3 OpenAI
42.3
80.1 71.1
10 文心一言 4.0 baidu
40
76.7 72.1
11 Qwen Max Alibaba
38.3
72.7 71.5