YZ Index
AI模型档案
查看每个模型的详细评分、五维能力评分和历史变化
豆包 Pro
volcengine
76.5
#1 / 11
综合表现最强,代码执行领先,工程判断领先
DeepSeek R1
DeepSeek
74.1
#2 / 11
任务表达并列最高,可用性并列最高
DeepSeek V3
DeepSeek
73.9
#3 / 11
任务表达并列最高,性价比最优,可用性并列最高
文心一言 4.0
baidu
70.9
#4 / 11
可用性并列最高
Gemini 2.5 Pro
Google
66.3
#5 / 11
任务表达并列最高,可用性并列最高
Claude Sonnet 4.6
Anthropic
63.0
#6 / 11
任务表达并列最高,可用性并列最高
Qwen Max
Alibaba
63.0
#7 / 11
可用性并列最高
Grok 3
xai
62.7
#8 / 11
材料约束领先,任务表达并列最高
Claude Opus 4.6
Anthropic
60.5
#9 / 11
任务表达并列最高,可用性并列最高
GPT-4o
OpenAI
58.9
#10 / 11
综合表现稳定
GPT-o3
OpenAI
57.9
#11 / 11
综合表现稳定