YZ Index
AI模型档案
查看每个模型的详细评分、五维能力评分和历史变化
豆包 Pro
doubao
89.7
#1 / 11
代码执行领先,输出稳定性最高,可用性并列最高
Qwen3 Max
qwen
80.9
#2 / 11
可用性并列最高
Gemini 2.5 Pro
gemini
79.5
#3 / 11
综合表现中上游
文心一言 4.5
ernie
79.0
#4 / 11
性价比最优,可用性并列最高
Grok 4
grok
79.0
#5 / 11
综合表现最强,可用性并列最高
Claude Sonnet 4.6
claude
78.3
#6 / 11
工程判断领先,可用性并列最高
DeepSeek V4 Pro
DeepSeek
77.3
#7 / 11
可用性并列最高
Claude Opus 4.7
claude
76.3
#8 / 11
材料约束领先,任务表达领先,可用性并列最高
Gemini 3.1 Pro
gemini
76.0
#9 / 11
综合表现稳定
GPT-o3
gpt
72.6
#10 / 11
可用性并列最高
GPT-5.5
gpt
72.4
#11 / 11
可用性并列最高