跳到主要内容
YZ Index

赢政指数 · 可用性排行榜

API调不通、超时、报错、拒绝服务——全算失败。再聪明用不了等于零。

排名基于最近 5 次评测滚动均值,非单次成绩

# 模型 可用性 稳定性 代码执行 主榜分
🥇 Claude Opus 4.7 claude 1/5 轮
100
67.7 89.3 77
🥈 Claude Sonnet 4.6 claude 1/5 轮
100
62.7 85.8 79
🥉 DeepSeek V4 Pro DeepSeek 1/5 轮
100
本期 99
59.1 86.8 77.5
4 豆包 Pro doubao 1/5 轮
100
本期 96
71.2 93.9 91.3
5 文心一言 4.5 ernie 1/5 轮
100
本期 99
44.2 83.6 78.8
6 GPT-5.5 gpt 1/5 轮
100
51.8 78.6 72.5
7 GPT-o3 gpt 1/5 轮
100
本期 98
58 82.2 73
8 Grok 4 grok 1/5 轮
100
68.6 93.9 79.9
9 Qwen3 Max qwen 1/5 轮
100
59.8 88.1 82.1
10 Gemini 2.5 Pro gemini 1/5 轮
99
本期 87
66 86.8 81.2
11 Gemini 3.1 Pro gemini 1/5 轮
99
本期 100
63.2 86.8 77.9