跳到主要内容
YZ Index

赢政指数 · 可用性排行榜

API调不通、超时、报错、拒绝服务——全算失败。再聪明用不了等于零。

排名基于最近 5 次评测滚动均值,非单次成绩

# 模型 可用性 稳定性 代码执行 主榜分
🥇 Claude Opus 4.6 claude
100
36.6 88.3 69
🥈 DeepSeek R1 DeepSeek
100
32.2 87.6 80.9
🥉 DeepSeek V3 DeepSeek
100
32.9 88.7 82.9
4 Gemini 2.5 Pro gemini
100
36.6 91 77.2
5 Qwen Max qwen
100
31.6 79.5 73.8
6 Claude Sonnet 4.6 claude
99.8
本期 99
36.1 88.3 72.4
7 豆包 Pro doubao
99.8
本期 100
38.9 93.1 85.8
8 文心一言 4.0 ernie
99.8
本期 100
29.9 79.6 79.5
9 Grok 3 grok
99.3
本期 99
34.4 84.8 73.4
10 GPT-o3 gpt
88.3
本期 87
31.7 77.6 62
11 GPT-4o gpt
87.8
本期 91
29.6 75.7 63.3