YZ Index
赢政指数 · 可用性排行榜
API调不通、超时、报错、拒绝服务——全算失败。再聪明用不了等于零。
排名基于最近 5 次评测滚动均值,非单次成绩
| # | 模型 | 可用性 | 稳定性 | 代码执行 | 主榜分 |
|---|---|---|---|---|---|
| 🥇 | Claude Opus 4.7 claude 1/5 轮 | 67.7 | 89.3 | 77 | |
| 🥈 | Claude Sonnet 4.6 claude 1/5 轮 | 62.7 | 85.8 | 79 | |
| 🥉 | DeepSeek V4 Pro DeepSeek 1/5 轮 | 本期 99 | 59.1 | 86.8 | 77.5 |
| 4 | 豆包 Pro doubao 1/5 轮 | 本期 96 | 71.2 | 93.9 | 91.3 |
| 5 | 文心一言 4.5 ernie 1/5 轮 | 本期 99 | 44.2 | 83.6 | 78.8 |
| 6 | GPT-5.5 gpt 1/5 轮 | 51.8 | 78.6 | 72.5 | |
| 7 | GPT-o3 gpt 1/5 轮 | 本期 98 | 58 | 82.2 | 73 |
| 8 | Grok 4 grok 1/5 轮 | 68.6 | 93.9 | 79.9 | |
| 9 | Qwen3 Max qwen 1/5 轮 | 59.8 | 88.1 | 82.1 | |
| 10 | Gemini 2.5 Pro gemini 1/5 轮 | 本期 87 | 66 | 86.8 | 81.2 |
| 11 | Gemini 3.1 Pro gemini 1/5 轮 | 本期 100 | 63.2 | 86.8 | 77.9 |