YZ Index

AI模型档案

查看每个模型的详细评分、五维能力评分和历史变化

豆包 Pro

性价比最优

DeepSeek V4 Pro

任务表达领先，输出稳定性最高

GPT-5.5

代码执行领先，工程判断领先，可用性并列最高

Claude Sonnet 4.6

可用性并列最高

Gemini 2.5 Pro

综合表现稳定

GPT-o3

综合表现最强

Grok 4

可用性并列最高

Claude Opus 4.7

材料约束领先，可用性并列最高

Gemini 3.1 Pro

可用性并列最高

Qwen3 Max

可用性并列最高

GLM-4.6

综合表现稳定