跳到主要内容
YZ Index

AI模型档案

查看每个模型的详细评分、五维能力评分和历史变化

豆包 Pro

volcengine
76.5 #1 / 11
综合表现最强,代码执行领先,工程判断领先

DeepSeek R1

DeepSeek
74.1 #2 / 11
任务表达并列最高,可用性并列最高

DeepSeek V3

DeepSeek
73.9 #3 / 11
任务表达并列最高,性价比最优,可用性并列最高

文心一言 4.0

baidu
70.9 #4 / 11
可用性并列最高

Gemini 2.5 Pro

Google
66.3 #5 / 11
任务表达并列最高,可用性并列最高

Claude Sonnet 4.6

Anthropic
63.0 #6 / 11
任务表达并列最高,可用性并列最高

Qwen Max

Alibaba
63.0 #7 / 11
可用性并列最高

Grok 3

xai
62.7 #8 / 11
材料约束领先,任务表达并列最高

Claude Opus 4.6

Anthropic
60.5 #9 / 11
任务表达并列最高,可用性并列最高

GPT-4o

OpenAI
58.9 #10 / 11
综合表现稳定

GPT-o3

OpenAI
57.9 #11 / 11
综合表现稳定